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(57) Abstract 

'Hie invention concerns recombinant vectors replicated in mycobacteria, a set of sequences coding for exported polypeptides detected 
by fusion with nlkalinc phosphatase, in particular one polypeptide, called DP428, of about 12 kD corresponding to an exported protein found 
in mycobacteria belonging to the Mycobacterium tuberculosis complex. The invention also concerns methods and kits for detecting in vitro 
the presence or a mycobacterium and in particular a mycobacteria m belonging to the Mycobacterium tuberculosis complex in a biological 
sample using said polypeptides, their fragments or ixilynucleotidcs coding tor the hitler. 'Hie invention also concerns immunogenic or 
\accine compositions for presenting and or treating infections eaused by mycobacteria and in particular a mvcobacierium belonging to said 
voir.plex, particularly (uIkmcuIosis. 

i 57 j Abrege 

I/iincnlion a pour objei des \ecteurs recombinants se replicant cluv les mycobactcnes. tin ensemble de sequences codant poui 
des polypeptides exponas dcteotcs par des fusions avec la phosphatase alcaline. notarnment un polypeptide, denomme DP4.X, d'cnviron 
I2kD correspondant a une proteme cxportce retrouvee dans les mycobactci ics appurtenant au complex dc Mycobacterium tuhcrndosi.\. 
L'mvemion eoncerne egalement des process et des kits de detection in vitro de la presence d'une rnycobactdrie et en particular une 
mycobacterie appurtenant au complete de Mxcobactcrium tuberculosis dans tin cVluntillon biologique utihsant Irsdits po!\ peptides, !cu;> j 
tiaivnenN on des polynucleotides covlant por.r ces derniers. 1 'invention vise des compositions imnumogenes on vaccins po;n la pio\ention : 
et Oil le tiaitement d 'infection-. p-o^Kjue'es par des mycohac:e: :es c\ en puiti.. ulier ;aie mwobjeterie appartenant audit coinplexe. en ( 
paita ulie: la uilvicalose. 
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Sequences nucleiques de polypeptides exportes de 
mycobacterieB, vecteurs lew comprenant et applications au 
diagnostic et a la prevention de la tuberculosa. 

L ' invention a pour objet de nouveaux vecteurs 
recombinants de criblage, de clonagc ct/ou d 1 express ion se 
.repliquant chez ies mycobacteries . Elle a ega] ement oour 
objet un ensemble de sequences codant pour des polypeptides 
exportes detectes par des fusions avec la phosphatase 
alcaline et dont 1' expression est regulee (mduite ou 
reprimee) ou constitutive lors de 1 ' ingestion des 
mycobacteries par les macrophages. L' invention concerne 
egalement un polypeptide, denomme DP428, d' environ 12kD 
correspondant a une proteine exportee retrouvee dans les 
15 mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis. 1/ invention vise aussi 'un polynucleotide 
comprenant une sequence codant pour ce polypeptide. Elle 
concerne egalement l 1 utilisation du polypeptide ou de 
fragments de celui-ci et des polynucleotides codant pour 
ces dcrmcrs (ou encore les polynucleotides complementai res 
a ces derriiers) pour la realisation de moyens de detection 
in vitro, ou in vivo dc la presence d'une mycobacteria 
appartenant au complexe de Mycobacterium tuberculosis dans 
un echantillon biolcgique ou pour .a detection de react ions 
de i'hote infecte par ces esp-o-s bar r. e i i enues . IO invention 
entin ^'utilisation au polypeptide ca de i.ragments de 
■ ■ " 1 Li - " - : ams: que <ues p :, * y n ;;;i e c 1 1 de s cda;:* pour ces 
dormers en tant que mayeiis destines a la preparation d'une 
composition immunogene, susceptible d'mduire une repnnse 
immunj taire di rig-o cont re 1-s myc^bacte r i^ f; appartenant au 
complex^* a*, 1 Mycobacterium tuberculosis, ou d'nn*- 
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La presence invention a aussi pour but d'utiliser ces 
sequences (polypeptidiques et pol ynucleot idiques ) comme 
cible pour la recherche de nouveaux inhibiteurs de la 
croissance et de la multiplication des mycobacteria ct de 
leur maintien che? 1'hote. ses inhibiteurs pouvant servir 
d ' antibiotiques . 



sjui eumpiend au moins b>6 
especes differentes, inclur. des palhogenes hutnains ma j euro 
tels que W. leprae et M. tuberculosis, ] es agents 
responsables de la iepre et de la tuberculosa, qui restent 
des problemes graves de santo publiquc dans le monde 
entier . 



La tuberculose continue d'etre un problems de sante 
publique dans le monde. Au jourd • hui , cette maladie est la 
cause de 2 a 3 millions do marts dans le xonde of. environ & 
2<) millions de nouveaux cas «ont observes chaque annee 
(Bouvet, 1994). Dans les pays deveioppes M . tuberculosis 

la cause ia ^ ^wnc des infections 
mycobactenenues. En France i] apparait environ 10 000 
nouveaux can par an et panr.i les maladies A declaration 

nc,,bre de car;. Li vaccina': icn par hc;; (Bacill" 

Calmed ot ;; :i .-r t r. , U :;., s:uch, aviruiente derive, m 



..hi L re 1 a 



tuberculose, oat loin d'etre eificac 

populntions. ('ot.r.n pfficaci^ van- onviro:: a- pi 



:i u ; ; o in ci e toutcs In-- 
aaas 
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une tuberculosa rsnden: HL-cessaire la mice au point de 
met nodes rap ides, specifiques ct fiables pour le diagnostic 
de la tubcrculose et la mise au point de nouveaux vaccins. 
Par exemple, une etude epidemiologique realisee en Floride, 
et dont les resultats ont ete P ubli6s en 1993 dans AIDS 
therapies, a montre que 10 °< des malades atteints de SIDA 
aonc auceints de tubcrculose au moment du diagnostic du 
SIDA ou 18 mo is avant celui-ci. Cnez ccs malades, la 
tuberculosa apparait dans GO % de, cas sous une forme 

disseminee Hnnr nnn ronAv.u^, , . . 

- -t- • h<ux. ici, en teres de 

diagnostic classiques comme :., radiographic pulraonaire ou 

1 'analyse de crachats. 

Actuellement, une cerr.itu,:, sur le diagnostic apporte 
par la rrnse en evidence de bacilles cultivable* dans un 
prelevement provenant du malade n-esc obtenue que pour- 
moms de la moitie des cas de tuberculosa, meir.e dans les 
cas de tuberculosa pulmonaire. be diagnostic de la 

tubcrculose et de^ aetres • • , , .... 

' LILj • - * * J - * : ' ■ i "e apparent.ees est 

done difficile a realise::, 
raicons : les mycobacter io :; :: , ;v 
faible quantite, leur temp;; ■■ i* • : 



:*'■! pour diffcrentes 
souven t presenter, e:i 
1 r a r : 1 est res 1 ono 



(24h pour M. tuberculosis) e- , (j;; >- c;i ] ru , (1 GC; > c ; l[f] 
( Dates et a 1 . f 1966 ) 
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cultures repetees (Hates, 1979 ; Bates et al . , 198C)) et 
couLeuse . 

b) Les techniques serologiques peuvent s'averer utiles 
dans certaines conditions, mais leur utilisation est: 
parfois limitee par leur sensibilite et/ou leur specificite 
faibies (Daniel et ai . , 1987). 

c) La presence de my-obacter i es au sein d 1 un 
^ tiLie aeuerrrunee par 

hybridation moleculaire avec dc i 1 ADN ou de 1 1 ARK en 
utilisant des sondes d ' ol i gonucl eotides specif iques des 
sequences recherchees (Kiehn et al., 1937 ; Roberts et al . , 
1987 ; Drake et al . , 1 937). Plusieurs etudes ont rr.ontre 
I'mteret de cette technique pour ie diagnostic des 
infections a mycobacterias. Les sondes utilisees sont 
constitutes d ' ADN , d ' ARN r:bosc,:que ou de fragments d ' ADN 
ycobactenens provenant de oanque de genes. Le principe de 
ces techniques repose sur le pol ymorph i sme des sequences 
nucleotidiques des fragments utilises ou sur le 
polymorphisme des regions av^::;;::a-o:;. Dans tous les cas, 
lies necessitent 1 ' ut i 1 isat i sn de cuitur-s et :ie sont pas 
applicables directement. sur [>■,; Och.antilln 



rn 



e 



oioiogiques 



Da f a i b 1 e au a n t : t > 



e i L ( 



a u sen; 



un cc riant 
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second temps a 1'aide d 1 une sonde ol igonucleotidique 
capable de s'hybrider specif lquernent a 1 ' ADN amplifie. 

Un test de detection de mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 
sandwich (test utilisant une sonde de capture et une sonde 
de detection) a ete decrit par Chevrier et al . en 1993. l e 
complexe de Mycobacterium tuberculosis est un groupe de 
mycobacteries qui comprend M. bovis-DCG, M. bovis, M. 
tuberculosis, M. africanum et M. microti. 

Un procede de detection de faibles quantities de 
mycobacterias , appartenant au complexe tuberculosis, par 
amplification genique et hybridation directement sur des 
cchantillons bio]ogiques a ete mis au point. Ledit procede 
utilise la sequence d' insertion IS6110 (Brevet europeen EP. 

0 490 951 Dl). Thierry et ai . ont decrit en 1990 une 
sequence specifique du complexe Mycobacterium tuberculosis 
et nommee IS 6110. Certains auteurs ont propose 
d 'amplifier specif iquement 1 ' ADN provenant de 
Mycobacterium en utilisant der, axorces nucleiquen dans une 
methode d ' ampli f i ca- i on , telle que la reaction d<- 
polymerase en chaine (PGR) . Patel et a 1 . . ont decrit en 1990 

1 'utilisation de plusieurs amorces nucleiquen choisier, a 
partir d 1 un... sequence cor.r.uc en tan'; a;:- sop.c 
i ' ident i 1 i ca t ion de tuber--;: < ; < 

::;Ur '-" : : ■■^rixur. utiiiGant ces an-.v^, -V. i: 

di f Cerent. e do la ionqueur theorique at t.eridue et plusieurs 
fragments cie taillo variable etaient obtcnus. De plus, i eK 
auteurs ont observ'- 1 ■ .-lh^o^,-., a . : _ ._ . 



uar. 

:opor.dant. , la ] cnm:^.- 
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detection de A*. tuberculosis , de grande sensibilize, par 
amplification d'un fragment d ' AON de M. tuberculosis 
localise au sein de la sequence IS6110 (Brevet, europeen EP 
461 045) a l'aide d'amorces g£nerant des fragments d ' ADN 
amplified de longueur constante, meme lorsque le choix des 
amorces conduisait a 1 1 ampl i f ica t i on de fragments longs (de 
l'ordre de 1000 a 1500 bases) oU le risque d 1 interruption 
de la polymerisation est elevee en raison des effets de la 
structure secondaire de la sequence. D'autres amorces 
specif iques de la sequence IS6110 sont decrites dans le 
brevet europeen N° EP-04 9 0 951. 

Les mventeurs ont montre (resultats non publics} que 
certains isolats clmiques de Mycobacterium tuhercul os i s 
etaient exempts de ia sequence d' insertion IS6110 et ne 
pouvaient done etre detectes a l'aide des oligonucleotides 
speeifiques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement negatifs. Ccs resultats 
conlirment une observation si:nilairo faite par Yuen et al . 
en 1 993. L ' impossibility de detector ces couches pathogenes 
potent lellement presentes dans un echant i 11 or. bioiogique 
pre 1 eve sur u:i patient est amsi susceptible de conduire a 
des difficultes voire des crreurs de diagnostic. La 
dispon i bi 1 i t ^ de plusieurs sequences speeifiques du Basil ]e 
de ia tubercu'l ose , a i ' : nter i.eur desc;uelles dor, a::;o: 
appropr i ees pou: V anpl : f i ca 1 1 c:: se rent choisis, est. 
important*: . :.,t r -que no..- 1 i'4 2 deorite : c i pourra -r re 

bov: s <>t; . tubcrru 1 os i r , 1-s agents ouur;a 1 s i" I a 
•.uber:-i; 1 osp , S'-:;' des b V* * > : . . : : r ,. ; ; - - r - . - 

ce 1 1 u i a i re s 
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eradiquer 1- invasion par dos microorganismes. Ces agents 
sont capables de modulcr 1 ' evo] \;t i on r.ormale de leur 
phagosome et de le.s empecher de se differcncier en un 
con.partiment acide riche en hydrolase (Clemens, 1979 ; 
5 Clemens et al . , 1996 ; Sturgi 1 1 - Koszycki et al . , 1994 et X u 
et al., 1994). Cependant, cecte modulation n'est possible 
que si la bacterie est vivante au sein du phagosome, 
suggerant que des composes syr.thet.ises de maniere active 
et/ou secretes a l'mteneur d- 1 „ cellule font partie de 
10 Ce m<§Canismc - Des P^oteines r.yportde« sont p t cbabi ement 
impiiquees dans ce mecanisme . Kn dopit des problemes 
ma ]C urs de santc lies a ces organises pathogenes' on sait 
peu de choses sur leurs prot.eme.s exportees et/ou 
secretees. Des analyses en SDS-PAGF. de filtrat de culture 
15 de M - tuberculosis montrent au moms 20 prolines secretees 
(Altschul et al., 1990 ,- Nagal .,] . * e t* Young et 

al., 1992) . Certaines d'entre e or.: etc caracterisees , 

leurs genes clones et sequences 
Wiker et al . ( 1992 et. Yamaqact: 
20 bi ^ T < qu'il s'agisse d'a — 



d ' importance majeure pour : :ui 
(Anderson et al . , 1991 el Or-, 
total cment identifies. En ry,; 
nomb r e u s e s protemes e x p o r \ 
membrane eel i ul a ire o*~ j^- 
p: e.^er.r e s p i:: . ; i^s surnaoeant 
protdines local : s>'>- 

^L'a do Vorsin.i i-'^cirio c ubcrji: 1 

1 ' i nternal i ne de ^ r - iOa de 

- ■ . 1^°1 ' * Ora—i - 

; rtarv. ciaru- " : nt.e .a y* : - 



remans et al , 198 9 ; 
■-^ ■ . 1 989) . T) 1 aulres, 

c:;::te orotecticye 



• 1 1 fj 
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reponse protect, r ice centre cette infection. Ccs proteines 
pourraient revetir un mteret certain pour la preparation 
de vaccins . 

5 Recemment, il a £te decrit 1 ' adapt at ion aux 

mycobacteries d'une methodologie g6netique pour 
1 ' identification et ia selection phSnotypique de proteines 
exportees (Lirn ec ai . , 1995). Ceute methodc utilise la 
phosphatase alkaline (PhoA) pe r : p 1 asm i que d'E. col i . Un 
vecteur pi as~id i que a consLiuit permettant la fusion de 

genes entre un gene PhoA tronquc et des genes codant pour 
des proteines exportees (Kanoil en al . , 1990). 

Par cette methode, il a pu erre identifie un gene 
15 de M. tuberculosis (erp (Berthet et al . , 1995)) presentant 
des homologies avec une proteme exportee rie 28 kDa de M. 
leprae, qui est une cible frequcnte des reponses humorales 
de la fornie 1 epromat euse de }a lepre. Une proteane 
presentant des motifs an:nca::ides caracr er istiques de la 
d ^ :ifir,IIa ^ J d ~ P^nte (des; a :u:ss: ele caracterisee par la 
technique d e fusion a v e c I ; h o A . 

Cependant, cette rrv-thede oenetique d 1 idem i f ; can 
de proteines exportees n>- pas d 1 C;valucr f ac: \-,,. n ,, t 

- s i ' exni essi on i :it race 1 lu ] a i re de 



^prehension des interactions cnt>- ies bactenes e 



ienes correspondant" s . : d:>.' 
c ; ■: irrordia ie a ] (1 f c : - 
1 i: • vaccins et: pen: 1 ci 

eur s 



cellules liot-os. 'induction de 1 ' express ion d- f. V f ( . 1; >- 
M) viiuieuce par contact do- c-il';>> .- \.] ; . t . r v.,^ 7 ^ 0 
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dc surtacc. 

Compte tenu de ce qui precede, il existc aujourd'hui 
un grand besoin de developper de nouveaux vaccins contre 
les mycobacterias pathogenies ainsi que de nouveaux tests de 
diagnostic s P 6cif iques, fiables et rapides. Ces 
developpements necessitent la mise au point d'outils 
specif iques encore plus performants permettant, d'une part, 
d'isoler ou d'obtcnir des sequences do nouveaux 
polypeptides spec.it iques, notamment immunogenes, et, 
d' autre part, de mieux comprendre le mecanisme des 
interactions entre les bacteries et leurn cellules notes 
comme notamment 1' induction de 1 ' express i on de facteur de 
virulence . Ceci est precisement l'objet de la presence 
invent ion . 

Les inventeurs ont defmi et realise dans ce but de 
nouveaux vecteurs permettant le criblage, le clonage et/ou 
1' expression de sequences d ' ADN dc mycobacteries afin 
d- identifier parni ces sequences, des acides nucleiques 
codant pour des prolines d'ir.teret, de preference des 
proteines exportees, pouvant etr- loc-ulisees sur la 
membrane bactenenne et/ou secretees, et d' identifier parmi 
ces sequences celles qui sont induiteo ou reprices Icrs de 
1 ' infection ; croissant' i r. r : , <t ' 1 ; -, : >■■ , . , 

Dob c r ip t i on 



-" Pi^sente invention deer:: ''utilisation du gen. 
rapporteur P hcA r.tw. ler : r,v;: cb ac >- " r j es 
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debut du gene, ses regions regular ices et son regulateur 
seront clones ce qui permettra d' observer une regulation. 
Si cette regulation est positive, le clonage du regulateur 
constituera un avantage pour observer 1' expression et 
5 1 1 exportation . 

Dans le contexte de 1' invention, or. entend par 
mycobaoterie toutes ies mycobacteries appartenant aux 
diverses especes enumerees par Wayne L. G. and Kubica G. P. 

. - n^uuiLLcnaceac m Bergey's manual of 

systematic bacteriology, J. P . Butler Ed. (Baltimore USA :. 
Williams et Wilkins V . 1436-1457). 



15 



20 



Dans certains cas les genes clones sont soumis dar. s 
leur bote d' engine a une regulation negative rendant 
1 'observation de 1 'expression et de 1 ' exportation difficile 
chez l'hote d'origme. Dans ce cas, le clonage du gene en 
absence de son regulateur ncgatif, dans un hote r.e 1 
contenar.t pas, constituera nr. avantag 



e 

n 



L ' invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayan: ;- u etre 

i soles au mover, des vertf-rq r, >-,'>,-,'., i,, ,, i- ,. . . 

' ccl 13 I - - '-'-"Uents et susceptiDies 

d'entrer dans la realisation do compositions noui. la 
dere..-ti.c;r. i • infection par d-. -y . i,acter ies , ou' P our ia 

pro*;. f2c\: ;. on contra uii<> ; :i feet; i < 



."i dor- :rycchat:^n 



. i ^ a 
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3) une cassette rapporteur comp ronanL : 

a) un site de clonagc multiple (pol yl inker ) , 
b} eventuellement un terminateur de transcription 
5 actif chez les mycobacteries , en amont du polylinker, 

c) une sequence nucleot idique codante issue d'un gene 
codant pour un marqueur d ' express i on ( d ' export a t ion et/ou 
de secretion de proline, ladi.te sequence nucleot mique 
etant depourvue de son codon d' initiation et de ses 

it) sequencps de regulation, ^t 

d) une sequence nuc leot id i q ue codante issue d'un gene 
codant pour un marqueur d'activ;!- de promoteurs contenus 
dans le meme fragment, ladite sequence nucleot idique etant 
pourvue de son codon ci ' i n: t : at : on . Eventuellement, le 

15 vecteur recombinant contient egalement un replicon 
fonctionnel chez E. coll. 



De maniere preferee, le ma iq ueur d ' export- at ion et/ou 
de secretion est place dans :., -erne or 



>r mentation que It 



marqueur d'activite de orcmoteu 



P refei e n t i e 1 1 e m e n t: 



— v '-- reco:.t:inant a* cnbla^ 

selon 1 ' invention conprenari, -.mm-, i;n ter-inatcur de 

transcription place en aval du marqueur d'activite d- 



promoteurs, ce qu: 
transcri ts courts 



'- ■ - " . cot em. .ion r 
; ' 1 cs e t qu i ( r .1 : 



nrodu i t; s a r - t. rndu c ^ 



m arqucur d ' e x po r t a 



:retion est 
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transcription, une sequence comprenant le site de liaison 
au ribosome (RBS) , les sequences responsables de 
1* exportation et/ou la secretion telles que la sequence 
dite sequence signal. 

Un premier marqueur interessant d ■ exportation et/ou 
d' expression est une sequence codante issue du gene phoA. 
Le cas echeant, elle est tronquee de telle tacon que 
l'activite phosphatase alcalme est cependant susceptible 
.re rcstauree lui^que la sequence codante tronquee est 
placee sous le controle d'un prorr.oteur et d' elements de 
regulation appropries . 

D'autres marqueurs d ' expos 1 l ion , d 1 export at i on et/ou 
de secretion peuvent etre utilises. On citera a titre 
d'exemples une sequence du gene (l-agaraso, de la nuclease 
d'un staphylocoque ou d ' une \] ~ lactamase. 



Panni les marqueurs i :'. t e r e s sa n t s d' act : vite :h 



raqment, on pre fere une 



promoteurs contenus dans ie :t>V 
sequence codante issue du gen- .uc iucileras- de- luciol- 
pour vug de son codon d ' i n i 1 1 a 1 1 on 



D'autres marqueurs d ; 'i:: 
dans le inerv.e fragrv.en: p"'iv<e. 
• ' ■ 'i'^xer.pifjr, une se:r;e:;'- 

Fluorescciit Protein ) 

Le term mat cur de tr an so 
chez les mvooKiet £ i i ^ <; - T1 to . 



r i i 



cici t etre 1 oucti ounel 
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Un vecteur part icul lerement prefere pour la 
realisation de 1' invention est un plasnudc choici parmi les 
plastnidcs suivants deposes a la CNCM (Collection Nationale 
de Cultures de Microorganismes , 25 rue de Docteur Roux, 
75724 Paris cedex 15, France) : 



1996, 



a) pJVEDa depose a la CNCM sous le n° 1-1797, l e 12/12 



b) pJVEDb depose a la CNCK sous le n° 1 - 1906, le 25 
iuillet 19 97 



c) pJVEDc depose a la CNCM sous le N° 1 - 1799 1 
12/12 1996. 



e 



Pour la selection, ou 1 ' identification de sequences 

d'acides nucleiques de mycobactenes codant pour des 

polypeptides susceptibles d'etre incorpores dans des 

compositions immunogenes, ou antigenigues pour la detection 

d'une infection, ou susceptibles d'ir.duire ou de reprimer 

un facteur de virulence de x.ycobacter les , io vecteur de 

1 ' invention corr.orcndra . en ~-\r- do- h^c i 

c -" • "•■ -"--•> sues de clonage 

multiple du polylinker, u.,e sequonc, de nucleotides d'une 
mycobacteria chez iaquelle cu dvLucte* la presence ae 
sequences correspondant a des polypeptides exporter et/ou 
secretes pouvant etre induitr ou reprices lors ' de 
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Lcs vecteurs de 1 ' invention peuvent en etfet egalement 
etre utilises pour determiner la presence de sequences 
d'interet, de preference correspondent a des proteines 
exportees et/ou sureties, et/ou capables d'etre induites 
ou reprimeea ou produites de facon constitutive lors de 
1' infection, nolamnent lors de la phagocytose par les 
macrophages, et selon ce qui a cue expose precdde.nme.nt, 
chez des trycobacteries te] les que afric^nun, M. bovis, 

M. avian, ou M . leprae dont on aura traite 1 ' ADN ou 1 • ADNc 
par fr,n men taticn physique ou avec des enzymes determines. 

Selon un premier mode de realisation de 1' invention la 
digestion enzymatique de 1'ADN genomque ou de V ADN 
complementaire est effectuee a partir de M . tuberculosis. 

De preference cet ADN est digere avec une enzyme telle 
que sau3A, BclI,BglII. 

D'autres enzymes de digestion telles que Seal, Apal, 
Sacll, Kpnl ou encore des nucleases ou dec polymerases! 
peuvent naturellement etre miscs er. oeuvre, des lors 
qu'clles permettcnt l'obtention do fragments dont. \es 
extremtes peuveu-. etre msoree's uans 1 ' u;: d-.v: 
clonage du polylinker du vecteur <ie 1' invention. 

Lc cas ficheanr , des digestions avec rii f fe- 
'■•!r.-.y:neu L=eront of. foctuee::. f>ir:uit ,•}!>•'••>»><••• 



iites 



suivanfs deposes A la CNCK : 



•■' :• : p ju: la real . sat : 

■J : i e .<-. v e c t e u r s r e corv.b -. n . . : : 
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e) pDP428 depose le 28 janvior 1997 a la CNCM sous le N°i- 
1818 , 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
3 1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N° I - 

1820 , 

h) P 2D7 depose le 28 janvier 1 997 a la CNCM sous le N° I - 

1821 , 

If) i 1 nl sl^^^^A ^ ^ i . , „ . . 

^ jruiviur. .yy; a la CNCM sous le N° I - 

1 84 3 , 

J) pJVED/M. tubernWosis depose :.. 2 b juillet 1 997 a la 

CNCM sous le N° 1-1907, 
k) P M1C25 depose le 4 aoGt 1 993 a ] a CNCM sous le r:°l-20G? 

15 

Parmi les plus preferes, r,: prefere le vecteur 
recombinant P DP42R depose le 2- janvier 1997 a la CNCM sous 
le N°I-1818, et le vecteur pMIC2a depose le 4 aout. 1998 a 
la CNCM sous 1 e N ° T - 2 0 6 2 

20 



L ' invention a egalempi;:. : 
criblatje de sequences d-- 
mycobacterias pour determ n- : 
correspondant a des polype-: : a* 
pouvant etre indui. ts ou re; a i--' 
sequences :d ocioLrices o*- 



d'iriteret, on tout; ou partie ; 
1 end: ts poly pert. : des , cui ae>. - r 



;: obie'. un precede d- 
: - >: ' ' - - • d";, : ssues de 
t presence de sequences 
"xpor'e-s <" /(-,.. ^e C re^;es 

' ' ' ' 1 i- aver l se r 
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determinee et la recuperation des f rayrnerits obtenus ■ 

b) 1' insertion des fragments obtenus a 1'etape a) dans 
un site dc clonage, compatible le cas 6cheant avec 1 'enzyme 
de l'6tape a), du polylinkcr d-un vecteur scion 
1 ' invention ; 

O si besom, 1 'amplification desdits fragments 
contenus dans le vecteur, par exenple par replication de ce 
dernier apres insertion du vecteur ainsi modifie dans une 
cellule determinee, de preference E col 1 ■ 

d) la transformation des cellules botes par le vecteur 
amplifie a 1'etape c) , ou en 1 ■ absence d ' ampl if ica t ion , par 
le vecteur de l'etape b) ; 

e) la culture des cellules hoces transferees dans un 
milieu permettant la mise en evidence du marqueur 
d'exportation et/ou de secretion, et /ou du marqueur 
d' activate de promoteurs content: dans le vecteur ; 

f) la detection des cellules botes positives (colonies 
positives) pour 1' expression du marqueur d ' exportation 
et/ou de secretion, et /cu du marqueur d'activite de 
promoteurs ; 

g) l'isolement de 1 ' AOs des colonies positives et 
insertion de cet ADN T dar.s sr...' cellu 



l uent ique a r :c ; i 



contention dans le 



dc 1 1 etape c) ; 

h) la selection des ::us-r: i or 

vecteur, per met rant 1. ' sb ten t : u- * . - <- - - ; , 

marqueur d ' expert at ion - s. . t : r r. ->-s* 0 . ^ , . 

"tirquour d ' as t ; vi t e d-> : : •■• •«•;:;< 

1 '' * 1Ll Jlo:ne:: ' -a ■:: u'ac-..L'Msar ::: des iraamerits 

d'ADM de mycobacterias ron'or.n-; dans ces mserats, 
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marqueur d'activitc de prornoteurs lorsque lesdites cellules 
notes sont phagocytees par des cellules du Lype 
macrophagique . 

De maniere plus sp6cifique, on compare la stimulation 
de 1' expression du marqueur d ■ activity de prornoteurs chez 
des cellules hotes placees en culture axenique (cellules 
hotes scales en culture) a la stimulation de 1 'expression 
du marqueur d'activitc de prornoteurs chez des cellules 
hotes cultivees 

r-----.^. ul- macropnages et ainsi 
phagocytees par ces derniers. 

La selection rie cellules notes positives pour l e 
marqueur d'activite de prornoteurs peuf etre realises des 
l'etape e) du precede de criblage decnt ci dessus, ou 
encore apres 1'une quelconque des etapes f ) , g) , h ) ou i), 
e'est-a-dire unc fois que les cellules hotes ont etd 
selectionnees posi t i vement pour ] e marqueur d ■ exportation 
et/ou de selection. 

La mise en oeuvre de ce precede per.net la construction 
de banques d • ADN con.pnrta.it. des sequences correspond,!^ A 
des polypeptides susceptibles d'etre -xportes et/ou 
secretes, et/ou susceptibles d'etre mduits ou reprint 

lors de 1 ' i nf ect. i on lorsai:' :I 



nycobactcries rocotnbinante^ . 
co-prenare un- -t 



'~' T -tiL)e i) du proccd-; 



" Pr-Mferenca, dan:; } e priced- sp]q :i i 

y Utilise or;' <^ r, ■ ^ . 



invent: 1 on 
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IS 



lc procede de criblage est caracterisc en ce que les 
sequences de mycobacterias sent issues d'une mycobacterie 
pathogene, par exemple de M. tuberculosis, M. bovis, M . 
avium, M. africanum ou M . leprae. 

5 

L 1 invention comprend egalement une banque d ' ADN 
genomique ou d'ADNc complementaire d ' ARNm de mycobacter ie , 
caracterisee en ce qu'elle est obtenue par up. procede 
comprenant: les etapes a)et b) , ou a), b) et c) du procede 
10 precedent se ion 1 ' inver.tiun. de preierence une banque d ' ADN 
genomique ou d ' ADNc complementaire d ' ARNm de mycobacteria 
pathogenes, de preference de mycobacter ies appartenant au 
groupe du complexe Mycobacterium tuberculosis, de 
preference de Mycobacterium tuberculosis . 

15 

Dans la presente invention, on entend designer par 
"sequences nucleiques" ou "sequences d'acides amines" SEQ 
ID N o X a SEQ ID N° Y , ou X et Y peuvent representor 
independammer.t un nombre ou un caractere a 1 phanumer ique , 
2<» respect ivement 1' ensemble des sequences nucleiques ou 
1' ensemble des sequences d'acides amines rep. -seritees Dar 
les figures X a Y, cxtrenir.es comprises . 

Par exemple. les sequences nueleiqu«s cu les seauenees 



a ' a c l d e a m me s S F. r> 



' n 



^: i. - 



4N sont 



respect ivexent les soauenr<-r; nucleic.,-.. l , - 

.•.--de., r ep r e s- : r.t • s pa: les f;qures 1 a .*, r , - 

"; :i:r ' ; : " s ; ;, -" :Liv - ;;iei '' ies sequences r.-.ic! • ques ou ies 
sequences d'acides amines 55 HQ TD N° i, SE'J ID N° l/> ctto 

- !•'" : h ■ , 5; Ko in r;- j : - • q- " 



-iJ N" i:: , si-:q k; if 
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nucleotidiques de mycobacteries ou comprenant des sequences 
nucleotidiques de mycobacteries select lonnees apres la 
realisation du precede selon 1' invention ci-dessus decrit. 



De preference, ladite mycobacterie est choisie parmi M 
tuberculosis, M . bovis, K . afneanum, M . avium, M. leprae, 
M. paratubercuiosis, M . kansassi ou M. xenopi . 



15 



20 



25 



On prefere les sprmonr^a ™ , ^ i * ; ^ ; _ 

, „ iai H u^b aii niycooacteries 

ou comprenant une sequence nuc loot i clique dc mycobacterie 
ladite sequence nucleot idique de mycobacterie etant choisie 
parmi les sequences de fragments d ' ADN de mycobacterie de 
sequence nucleique SEQ ID N° 1 a SEQ ID N° 24C, SEQ ID N° 
27A a SEQ ID N° 27C, SEQ ID N° 29 ,a SEQ ID r 31A a SEQ ID 
"° 50F, respectivement representees par les figures i a ^4C 
'planches 1 a 150), par les figure 27A k 27c (planches ^ 
a 154), par la figure 29 (pianche IbG) et par les figures 
31A a SOF (planches 158 a 275) 



Selon i;n mode de realisation 
des sequences preferees sor/ 
ri'ADN de mycobacteries de sea;..;. 
SEQ ID N°5A, SEQ ID N°6A, 5Dj 
N°9A, SEQ ID N^lOA, SEQ ID 
respect ivernent dans lor, ve;;:.- 
p6D7 (CNCM, N° I - 181-". ) , pSI-; . : ^ 
K°I-1817; ( p5B5 ( CNCM , N ,J 
L-'2D7 (CNCM,N° i -1821) , plB7 
"-"I 1815) et pM!C2 5 ( CNC?-: r.°i- 



; ^ i e 

'•"I: 



° 7 A . 



i 1 invention, 
les t ragmen:: s 
' ; : , SEQ ID N°3A, 
ID N°8A, SEQ ID 

D contenus 
-'NCK, N° I -181 8 1 



(CNCM 
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20 



a 



isole par exemple de la facon suivante : 

a) preparation d ' une banque de cosmides a partu de 1 • ADN 
de M. tuberculosis, par exemple selon la technique decrite 

5 par Jacobs et al., 1991; 

b) hybridation de tout ou partie d • un acide nucleique 
sonde de sequence choisie par example parmi SEQ ID K' i 
SEQ ID N ° 24C, SEQ ID K « 2 7 A a SEQ ID t j- 27 C , SEQ ID N° ,q 
ct SEO ID N" .1 1 A a SEQ I ::■ N - 50:-' avec les cosmides de la 

io banque prealablement preparee a I'etape a] ; 

O selection des cosrr.ides hybndant avec 1'acide 
nucleique sonde de I'etape b) ; 

d) sequencage des inserts d ' ADN des clones selectionnes a 
I'etape c) et identification du cadre de lecture ouvert 

15 complet ,- 

e) le cas echeant, clonage des inserts sequences a 
I'etape d) dans ur. vecteur d ■ expression et/ou de clonage 
appropr ie . 



20 



Les acidpr ' micIe: ^ es cc:rprena::t la total ite du cadre do 
lecture ouvert des .sequence 

SEQ I \j i;° ? 7 A a SEQ 7 7) ::° 

31 A a SEQ ID N u f»0F s 

pre feres . 



m.;- ; ;;»:o id n° ?4c, 

-' 1 - >-:> et SEQ ]j 

on:: paran. les acide* nucleiques 



7' p c: o t 



c:e gene cod*:it poi:: s:. vuiyper: ; ■ ,- xv 
avec la sequence du geucr- puLli^* par C 
al., 1 998, Nature, 393, 537- :>4.; 



gene -s entier portart Pi uequene- i 
present e ; indent; : or: . 



perir.et ue ri^teiminor 1 

i-- selon .1 
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selon 1- invention et s'etendant. d 1 une part en b ' de ces 
sequences jusqu'au premier codon d ' initiation de la 
traduction (ATG ou GTG) ou meme jusqu'au premier codon 
stop, et d- autre part en 3 • de ces sdquences jusqu'au codon 
stop suivant, et ceci dans 1 ■ une quelconque des trois 
phases de lecture possibles. 



Les sequences nucleotidiques conplementaires des 
sequences ci-dessus selon !■ invention font egaJement partie 



1 • 



1 nuonh • 



Par polynucleotide dc sequence co.nplementaire d'une 

sequence nucleotidique selon 1' invention, on entend touLe 

sequence d'ADN ou d 1 ARN dont les nucleotides sont 

complementaires de ceux de ladite sequence selon 
1' invention et. dont 1 ' orientation est inversee . 

Les fragments nucleotidiques des sequences ci-dessus 
selon 1- invention notammcnt utiles en. Lar.t que sondes ou 
amorces font egalement. partie de 1' invention. 

L- invention concerne ausai les polynucleotide 
caractenses „n c, qu'ils comprennent ur. polynucleotide 

choisi parrni : 

■3) u:i polynucleotide don:. la soauenrv 
Iri .sequence d * ur: polynucleotide s--' ): 



1 r 



poiynucle; 
d 1 ido n t i Lm avj-: 

un polynucleotide hybriuaut daru 
stringency ave f 
I 1 invent ion , 



a i : 



^ mvent tor;, 



: nv 



des conditions d^ forte 
une sequence de polynucleotide selon 
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20 



Lorsque la sequence codante issue du gene marqueur 
d' exportation et/ou de secretion est une sequence issue du 
gene phoA, 1 ' exportation et/ou la secretion du produit du 
gene phoA, le cas echeant tronque, n'est obtenue que 
lorsque cette s6quence est inseree en phase avec la 
sequence ou element de regulation dc 1' expression de la 
production de polynucl6otides et sa localisation placee en 
amont, qui contient lea elements controlant 1 1 expression , 
l 'exportation et/ou la secretion issus de sequence de 
mycobacteries . 

Les vectcurs recoxbinant.s de 1' invention peuvcnt bien 
entendu comprendre des sites de clonage multiples decales 
de un ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant amsi d'expnmer le polypeptide 
correspondant au fragment d ' ADN de mycobacter ie insere et 
susceptible d'etre traduit selon 1 • un des trois cadres de 
lecture possibles. 



Par exemple les vecteurr, prefers pJVKUb et P JVED= de 
1' invention se distinyuent du vecteur preiere pJVEPa par un 
decalage respectif dc un et ::e deux nucleotide* au niveau 

on :Mt:e de cloiirig^ vmltipLe. 



* l " ll0i ' ' -e^ew::, •• , ' invent: icn Gor;t. capah ; es 

ao * lJ P— ypeptaaes sur>0'pt idles d'etre 

-odes par un fragment d ' AI3N d- i.ycobac: ter i o inhere. Cesdits 

polypeptides, caractens^; o- r ^ an ' i -r^- 

~ ■ * " m - 1 i . . -i -'0.r„ done 
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ID N° 27A a SEQ ID N° 28 et; SEQ ID N° 30 a SEQ ID N° 50F et 
representees respect lvement par les figures 1 a 24C 
(planches 1 a 150) , les figures 27A a 28 (planches 152 a 
155) et les figures 30 a 50F (planches 157 a 275) . 

Font 6galernent partie de 1 1 i n vent, ion , les fragments ou 
fragments biologiquement actifs ainsi que les polypeptides 
homologues desdits polypeptides. Fragment, fragment 
biologiquement actif et polypeptides homologue de 
polypeptide, etant r.els eme def:ms ci api^ dans la 
descr i p t ion . 



L' invention coiicerne e 
comprenant un polypeptide ou 
I 1 invent ion . 



1 : t ' ;Tien: - les polypept ides 
un ce lours fragments selon 



L' invention a aussi pour ob-et des mycobacterias 
recombinantes contenant un vecteur recombinant selon 
1' invention decrit precedence:.:.. T J::e ny-ohnc ter le preferee 
20 est un^ mycobacterie du type ;■: . ::;•»?• ii : r . 

M. smeqrnatis permet r:a:i taqeu semen* de teste- 
rcfLicacitc de sequencer - ny eoisa st .e r i es , pour le 



controle de I'expre 



;ion ' (1 " i ' expoi tat icn et/ou de 1. 
secretion, et/ou de I'activit- de prnmoteurs d 1 une sequent 
uonuee f p a > exerr.ple d ' une :;e ':uen : --eia:e eou^ ■'*- in 3 , 
tt;I que la phosphatase a I :; a : : r.p ... ■ : : , ; , , . . r , , c , rj 



type A; . bo vi s , pa r e x e : • . \ , 
" " a c tuo 1 1 pine* nt uo u r .1 a v act: n at. 1 ■ 



■ >l A te> ; ,. 

t'e- u 1 1 i 1 see 



a tuner 
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prcsente chez Routes les souches testees de mycobacter .i es 
appartenant au complexe de Mycobacterium tuberculosis. Co 
polynucleotide, denomme DP428 conticnt un cadre ouvert de 
lecture (ORF) codant pour un polypeptide d'environ 12 kD. 
Le cadre de lecture ouvert (ORF) codant pour le polypeptide 
DP428 s'etend du nucleotide en position nt 941 au 
nucleotide en position nt 1351 de la sequence SEQ ID N° 2, 
le polypeptide DP428 ayant la sequence en acides amines SEQ 
ID N° 2f) suivante : 

MKTGTA7TRKRLL.AVLI ALALPGAAVALI,A!"PSATGASDPCAASE'VARTVGSVAKSMGD 

YLDSHPETNQVMTAVLQQQVGPGSVASLKAHFtANPKVASDLIiALSQPI.TDLSTRCSLP 
ISGLQAIGLMQAVQGARR . 

Ce poids moleculaire(PM) correspond au PM theorique de 
la proteine mature obtenue apres -livage de la sequence 
signale, le PM de la proteine ou polypeptide DP428 etant* 
d'environ 10 kD apres ancrage potentiel au pept idoglycane 
et coupure potentielle cntre S et G du notif I,PISG. 



polynucleot i rie inclu: , d 1 un>- 



par'., un cadre ouverL de 



ecture ccrrespondar- a un ge:,, structure ot, d 'autre 



expression d»' 1, 



part, :es signaux d^ reguiaUc;; d" 
sequence codanLe en a:::o::i ct en ava l r> cette derniere . Le 
polypeptide DP420 est: compose a < un peptide signal, 
region ceutralo hvdronh i i - • • - . ; - . 

hydrophobe. Cette dernier- te:on:o> pv d<-<- >-no--u r .. 

:irq: n 1 :v-r; w > ; ^ -n , „ , 

- ^ - ' ' prevent par 

- a r^'- — - o.,:_: Idd\TG d ' ancraqe c ni 
pept idoglycane (Sohneewind ev a 1 ^qq^ 
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25 



un 



Ainsi, 1' invention concernc en particulier 
polynucleotide dont la sequence est choisie parmi les 
sequences nucl 6ot idiques SEQ ID N°l a SEQ ID N°2. 



un 



Plus particulieremenl, 1' invention concerne 
polynucleotide caracterisd en ce qu • i 1 comprend un 
polynucleotide choisi parrm 



a) un polynucleotide dont la sequence est- choisic oarmi les 
sequences nucleot idiques SEQ ID N°l a SEQ ID N°2, 

b) un polynucleotide dont la sequence nucleique est la 
sequence comprise entre le nucleotide en position nt 964 
et le nucleotide en position nt 1234, extremities indues, 
de la sequence SEQ ID N°l, 

O un polynucleotide dont la sequence est compl emen t a i re de 
la sequence d 1 un polynucleotide defini en a) ou b) , 
d) un polynucleotide dont la sequence comporte au moms 50* 
d'identite avec un polynucleotide defini en a), b) ou c), 
20 e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) , c) ou d) , 

f) un figment d 1 au moms 3 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c), d)ou e). 



On cntend par sequence ; 
ou acid- nn-'lMique, selcn la r 
— : AD:: uoucDe brm, un ADD :/,:: 
t ranrjcript ion desdir.s ADD. 

Dar pourcentaac 1 ' ident^ 



c t m :. q u f i , p c > 1 y n u c 1 e o t i d p . 
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Une hybridation dans des conditions de forte 
stringence signific que les conditions dc temperature et de 
force lonique sont choisies de telle maniere qu'elles 
permettent le maintien de 1 1 hybr ida t ion entre deux 
5 fragments d ' ADN compldmcntai res . 

A tit re illustratif, des conditions de forte 
stringence de l'etape d ' hybridat; ion aux fins de definir les 
fragments polynucleot idiques decnts ci-dessus, sont 
a van tageusement les ninv^ntes ; 

1 'hybridation est realise- a une temperature 
preferentielle de 65°C, en presence de tampon commercialise 
sous le nom de rapid-hyb buffer par Amersham (RPN 163C) et 
100 /-ig/ml d'ADN de E.coli. 

Les etapes de lavage peuvent , par exemple, etre les 
suivantes : 

- deux lavages dc 10 mm, pre fe rent lei lement a 65°C, dans 
un tampon 2 x SSC et 0,1% SDS; 

- deux lavages de 10 mm, pre f e rent : el 1 emen t a 65°C, dans 
un tampon 1 x SSC et 0,1% SDS; 

un lavage d^ 10 min, pre fe rent i e 1 1 cment a 6E°o da~s u^ 
tampon de 0,1. x SSC et 0,1% SDS. 

1 x SSC correspond A 0,15 M NaCl et J,0bX c:trate de 
Na et une solution de 1 x Denhardt correspond a 0,02% 
Ficoll, 0,02% de po 1 yv my my :o . C ; uoii- o: i n ;.■ v m. 
a 1 bum i i : * bov me . 



Avanr ri'.p'-.;sem.e::t , on : \ , -y .->;•/ • m. -♦ , .,,,^,, ( ,, ; r 

i.a definition precedente aura an mo ins 6 nucleotides d' 
preference an moms 12 nucleotides, et cn:orn :) i u; 
[m e f erent : e 1 J ement au mom- - m ^ - ,o . . ■ 



2^ 
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Pour les conditions de mi so en oeuvre des enzymes de 
restriction dans l e but d'obtenir des fragments 
nucleotidiques des polynucleotides selon 1' invention, on se 
> referera avant agcusement a l'ouvraqe de Sambrook et al . , 
1989 . 

Avantageusement, un polynucleotide de 1 ' invention 
contiendra au moms une sequence conprerianr 1 • encha i nemen t 
'V. dc nucleotides allanr. riu nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ 10 
N° l . 



IS 



20 



n e f ^ 



La presence invention a pou 
selon i ' invention , car acterise 
nucleique hybride avec 1 1 ADN 
et pref erent iellement ave 
mycobacterias appar tenant a 
tuberculosis . 

Le polynucleotide e;c 
pclynucieot idique tell.' que u 



o b 3 e t_ un polynucleotide 
co que sa sequence 
que nee de mycobacte r ies 
ALL' de sequence de 
pi ex- de Mycobacteria 



sequo no- 



La pre son te 

^ Pol vpept i de .: sso 
^ e ' ; .1 e s t n rose 
op; o ' 



. nvent : ■ 



c a l a 
p i r •: 

a 



L ' invent ion 



r»o i s-: 



po ivpep'-. i 

' :de .000 
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c) un fragment; d ' au moinr, 5 acides amines d'un polypeptide 
def ini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide defmi 
en a ) , b) , ou c) . 

La presentc invention a aussi pour objel un 
polypeptide dont la sequence ri' ancles amines est comprise 
dans la sequence d'acides amines SPQ II; N°l ou 5PQ ID N°?, 
ou un polypeptide de sequence u'arides amines sen in m°2^. 

Par polypeptide homologue, on entendra designer les 
polypeptides presentant , par rapport au polypeptide nature: 
selon 1' invention tel que le polypeptide DP428, certaines 
modifications comme en particulier une deletion, addition 
ou substitution d 1 au moms un acide amine, une Lroncation, 
un allongement, une fusion chimenque, et/ou une mutation. 
Parmi les polypeptides homclogues, on prefere ceux dont la 
sequence d'acides amines presence au moins 30%, de 
preference 50%, d'honolcgie avec les, sequences d'acides 
amines des polypeptides selnn i ' invcuuon . Dans le cas 
d'urie substitution, un cu plus: ears acides amines 
soiisecutifs ou no:; con seen c. is, sort: : emp laces par dec 
acides amines « equivalents ». ; , 1 expre s s ion acide amine 
« equivalent .» vise ic: d^srui-o v-e , — <].. 



iscapt ible ;i 1 e t re sub 
. rncture a-- rase sari 



: » * cu u- • . a;: ices amines de la 

l' _, s proprietes immunoae n* • s d f, s ; d . » • cor re srcuidan*" s 

d'aatres tormes, les acides amm-s equivalents s-rccu x 

■u ' u n poly p r > c 1 1 c i e d e s e a u e n c ^ 



permit tent 1 ' cbtent l ■ 



modified qui permet 1 1 induction 



■t u - : l iriuot. i c :i .in v:v' \ an* i 



i 
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(polypeptide DP420) ou l'un do ses fragments ci-dessus 
de f i nis . 

Ces aminoacyles equivalents peuvent etre determines 
soit en s'appuyant sur leur homologie de structure avec les 
aminoacyles auxquels ile se substituent, soit sur les 
resultats des essais d ' immunogenic! t e croisee auxquels les 
differents peptides sont susceptibles de donner lieu. 



It) 



A titre d'exemple, on ment i onne r a les possibilites de 
subsrirnM.ons susceptibles d'etre effe^Luces sans qu'ii en 
resulte une modification approfondie de 1 ' immunogenic 1 te 
des peptides modifies correspondents, les rempl a cement s , 
par exemple, de la leucine par la valine ou 1 1 i sol euci ne , 
de I'acide aspartique par i'acide glutamique, de .,1a 
qlutamine par 1 • asparagine , de i'argimne par la lysine 
etc., les substitutions inverses etant nature 1 lement 
envisageables dans les memes conditions. 



Par fragment biologiquement actif, on enteridra 
2d designer en particulier un fragment de sequence d'acides 
amines de polypeptide presentant an moms une des 
caractenst lques des polypeptides selon 1 1 invention 
not amment en ce qu ' i 1 est : 

capable d'etre exporte et/ou secrete par une 
2S -vcobact-ri,, et/ou d'etre • C u reprime lors ;r> 

infection par la mycobacte i ic ; et/oi: 

capable 1 i ridu : i e , a- : r i mo- 1 : ; -e-> 

d i rec temen t; ou i n d i r e c V. e m e n * ♦ a * . > — -«\ . . , , , - t , ; 

t r. y c o b a cteri e ; e t / o u 
'° capable d'induire une reaction d 1 immunoqen i ::i r £ diiiu^- 

sen i. re les mycobacter i cr- ; /<:.'. 
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Un polypeptide de 1 ' invention, ou un de ses 

fragments, tels que definis precedemment , est susceptible 
d'etre reconnu speci f lquement par les anticorps presents 
5 dans le s£rum de patients infectes par de3 mycobactdries et 
pref erent iellement des bact6ries appartenant au complexe de 
Mycobacterium tuberculosis ou par des cellules de ] ' bote 
inf ecte . 

Font ainsi partie de 1' invention ler, fragments du 
10 polypeptide dont la sequence d'acides amines est comprise 
dans la sequence d'acides amines de polypeptide selon 
1 ' invention, telle que les sequences d'acides amines SKQ ID 
N°l a SKQ ID N ° 2 , ou un polypeptide de sequence d'acides 
amines SEQ 10 N°28, qui peuvent etre obtenus par clivage 
dudit polypeptide par une enzyme prot eoly t lque , telle que 
la trypsine ou la chymot ryps i ne ou la col lacjenase , ou par 
un reactif chimique, tei que ie bromure dc cyanogene ( CNDr ) 
ou encore en placant un polypeptide selon 1' invention tel 
que le polypeptide DP428 dans un env i rc nnement tres acidc, 
par cxemple a pH 2/j. Des fragments ceptidiques preferes 
selon 1' invention, pour une utilisation en diagnostic ou en 
vaccination, sont les Lragmcn.tr; contenus dans des regions 
de polypeptide selon I 1 i :ive:it ion tel quu ie polypeptide 
DP428 susceptibles d'etre natural lemcnt cxposees au solvant 
ef d*-* presenter ainsi d-s : jprietes d 1 i mmunoaen i c i t <-"> 
importantc. De tels fragments peptidiqueo peuvent etre 
prepares indi f; f eremment pa r svu: h-s- chimrque, a parti r 
* noi.c.s t r a i i s i onr.es p a r un ve c t eu y d 1 express 1 on * 
i 1 invent ion contenant un acid- nucleique per met taut 
.1 1 expression desdits fragments, place sous I e cent role des 
■ - - u' s ' i • 1 « : u 1 -xnrcssi am r : > • . . 
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do la SEQ ID N°20. Les resultats do cette analyse soru 
presentes a la figure 54, ou som detaiiles, pour chacun 
des acides amines (AA) de position definie dans la SEQ ID 
N°28, 1 1 indice d ' hydr ophi 1 i ci te . Plus l'indice 

d'hydrophilicitd est eleve, plus l'acide amin6 considere 
est susceptible d'etre expose an soivant dans la molecule 
native, el est en consequence susceptible de presenter un 
degre d ' antigenicity eleve . Ainsi, un euchalnement d'au 
moins sept acides amines possodant; un indice eleve 
d'hvdrnnhilicite ( > 0, 3 > pout i s >. i l ue r la base de la 

structure d'un peptide candidal iounogene selon la 
present e invention. * 



Les reponses immunitaires colluiaircs de 1 ' hote a un 
15 polypeptide scion 1* invention, peuvent etre mises en 
evidence selon les techniques decntes par Colignon et ^ 
1996 . 



ai . 



20 



D'apres les donnees s< 
presentee a la Figure : 3 4, 
regions du polypeptide DP-12P ; 
solvant , plus part icul iereme: 
les andes amines 5 5 et 7 2 :> 
la region local i sec entre les 
5L0 id r;° ?. r 



ia cart' 



d ' hydrophi 1 ic: t e 
:nt pu defim. r des 
. e m e n t o x p o s e e s ci u 
local i see est re 
dLQ ID ;■; ° 2» f ,f 
Vs 99 et 107 de la 



rS.' IS ' SI 



-nessss renvois s-v 

realisation ci e s s : - :r. n ■ j s 
npositions vaccmales selon 



.■as in;; 1 ; 
sv-nt i on 



ssa^nes 
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en cg que lesdites sequences sont choiuitis parnu les 
sequences d'acide nucleique do polynucleotides scion 
1 ' invention . 

L' invention concerne en outre 1 ' utilisation d 1 une 
sequence d'acide nucleique de polynucleotides selon 
1' invention comme sonde ou amorce, pour la detection et/ou 
1 'amplification do sequence d acide nucleique. Parmi cos 
sequences d'acide nucleique selon 1' invention utilisables 
comme sonde ou amorce, on pre f. ere les sequeriL^s d'acide 
nucleique de 1' invention, car ac tori see en ce que lesdites 
sequences sont des sequences, ou leur sequence 
complementaire, comprises entr.e le nucleotide en position 
nl 964 et le nucleotide en position nt 1234, extremir.es 
indues, de la sequence SEQ ID N°! . 



Parmi les pc iynucl cot i des 
utilisables comme amorces riud eot: 
particul lerement les polynuc leot ides 
X°2b et SEQ ID N°2 6 . 



se 1 on 1 ' i nvent ion , 
idiques, on prcfere 
de sequence SEQ ID 



Les polynucleotides sduu 1 1 .invention peuvent ai: 
eLie utilises pour select l c-rir.e >- des anorce; nucleot : d ; qu* 
notamment pour la technique PGR (Erlich, 1 9 39 ; Inn^s 
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brm ( + ) [amorce aller] de la natnce et 1'aulie amorce est 
complemenLaire du brin (-) [amorce rctour] . II est 
important que lea amorces ne possedent pas de structure 
secondaire ou de sequence complemcntaire 1 • une de 1' autre. 
5 D ' autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de maniere a ce que les amorces ne 
s'hybrident pas avec d'autres acides nucleiques provenant 
de cellules ' procaryotes ou eucaryoces, en particulier avec 
les acides nucleiquea provenant d'autres mycobac te r les 
l() pathogenes, ni avec 1 ' ADN ou l'ARN humain oouvanc 
eventuellemeiit contaminer ] 1 echant i 1 Ion biologique . 

Les resultats presenr.es A la figure 51, montrent que 
la sequence codant pour le polypeptide DP428 (SEQ ID N° 28) 
15 n'est pas retrouvee dans les ADN s de K. fortuitzum, M . 
simiae, M . avium, M . chelonac, M. fiavescens, M. gordonae , 
M. marinum et M . kansasii 

Les fragments amplifies peuver.t etre identifies apres 
20 une electrophoresc en gel d 1 agarose ou de uol yacry lamide , 
ou apres une elect rophoreso capi 1 1 aire, cu encore apres une 
technique chromat ograph i que 'filtration sur gel 

chromatographic hydrophobe uu enromat ographie cchangcuse 
d'ions). La specificite de .1 1 ampi i f ica t ion pent. -tie 
^ controlee par hybr i. nation :\ol esu ; a re nr. ut i 1 : sarv -or^ 
sondes les sequences nuc leot id iciues de ro': ynuo' *Vv ; • de 
■ 'invention, des p Jasmines • >>:^nr.. ees sequences ou .ours 
pr / i : i t s d' amp] i f ication . 

1(1 : - ,JS fragments nuclec:. i;hqu-.-; amplii. les peuver.t "'ti^- 

utilises comme reactils dans : ,a-io;is d ' hvrr l d , ti on 

aim do met t. re on ov-Imw , p r-d-noe , dans ur. ^-oharv : : ■ — 
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Parmi ies polynucleotides selon 1' invention, 
utilisables comme sondes nucleot idiques , on prefere tout 
particulierement le fragment polynucleot idique comprenant 
la sequence comprise entre le nucleotide en position nt 964 
S et le nucleotide en position nt 1234, extremites indues, 
de la sequence de SEQ ID N°l. 

Ces sondes et amplicons peuvent; etre marques ou non 
par des elements radioactifs ou par des molecules non 
10 radioactives, telles nun des enzymes ou cles elements 
f luorcscents . . 



L' invention vise egalement les fragments 

nucleotidiques susceptibles d ' etre obtenus par 

amplif ication a l'aide d 1 amorces selcn 1' invention. 

D'autres techniques d ' arr.pl i f ication de 1'acide 
nucleique cible peuvent etre a va n t ageusemen t employees 
comme alternatives a la PCR . 



15 



20 



ha technique SDA (Strand Displacement Amplification; 
ou technique d 1 amplification a emplacement de brin (Walker 
et al., 1392) est une technique < i 1 ampl i f i ca t ion isothorme 
dont le p:i:;cipe est fonde sur la eapacite d 1 une enzyme de 
restriction dc couper 1 ' un des d-ux brms de son site de 



25 reconnaissance qui se v.rcuve sous 



he mi pnosphoiothioate 



une 

p r a;:r ie te d ' une 



P^itii d-^ i ' ex t r*"Vn i r ^ 1 1 ■■•>■/'■,',,■> * , -- , - • 

' i " 1 • ' ' ' ie 

ies.r;ction et ne dep.ace?- i.um pre a 1 ab 1 emeii t synthetise 
qui s>- trouve en aval. 

bes polynucleotides >• ^ ' en p:i r t ca 1 i r : ,. : 
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- la technique 3SR (Sel f -Sustained Sequence Replication), 
dccrite par Guatelli et al . en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification), dccrite par Kievitis et al. en 1991; 
5 - la technique TMA [Transcription Mediated Amplification) . 

Les polynucl6otides de 1' invention peuvent aussi etre 
employes dans des techniques d 'amplification ou de 
modification de 1 ' acide nucleique servant de sonde, telles 
que : 

K) - la technique T-CR (Ligaoo Cham Reaction) , dccrite par 
Landegren et al . en 1988 et perfect ionnee par Rarany et al . 
en 1991, qui emploie une ligase t he r :v os t a bl e ; 

" la technique de RCR (Repair Cham Reaction) , docnte pur 
Segev en 19 92; 



■ ion) , deer l te par 



l> - la technique CPR (Cycling Probe Re 
Duck et al . en 1990 ; 

- la technique d • anpl i f ica t ; on a la Q - beta -repl icase , 
decrite par Kiele et al. en 195 J et per te- lonnee notamment 
par Chu et al. en 1 986, Lizard i er. al en 1 988, puis par 
2o Burq et al . amsi que par C ,-t »; ( > : . :99s. 



Dans jo car; ou le pclv:^ 
u n ARN , par e x e ;r, p ] e u n AV. R : ■ 
prealablement a la mise 
d ' amp 1 i f i car : on a Raid" r:*v; 
— 1 r.'.ise en ceuvre d'uu nr. j* 
co rider, de 1 1 : nveu 1 1 ;:n , nr.*- 
inverse ai' ::; d 1 ^bt eri ; r ' ;r 
dans 1 1 e chant i 1 1 on b i Oioq nim 
; ic ciide :: ] amorces e 

it' '1' ,imi; I M 



....Me fi »'c' i. 1 : e;; 

. : f ; e i i a v a r t a q e u s e me n t 
euvre d ' une react: in 

■ ' ' ■ * ■ ' * * : even', i on :y._. 
■I'-tM/-: :or a 1 1 aide A,- 

' : " 7 r ' ' t r ansc r i pt a n 

: - >t »u!u se :. v i ra a 1 or 
non-aer macs er, oeuvr 
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et do preference an means de 200 



moins lb nucleotide: 
nucleot ides . 

Les sondes nucleotidiques selon 1 ' invention sont 
capablea de detecter des mycobacterias et 

preferentiellement des bacteries appartenant au complexc de 
Mycobacterium tuberculosis, plus precisement du fait que 
ces mycobacteries possedent dans leur genome au moins une 



invention. Ces 



sondes 



copie de polynucleotides selon 
selon 1' invention, sont capables, par exemple, de 

n.^.LULiuique n un polypeptide 

selon 1' invention, plus particul lerement tout 

ol igonucleotide hybridant avec la sequence SF.Q ID N o, 
codant pour le polypeptide m>4?8 de [■' . tuberculosis, et ne 
presentant par, de reaction d • hybridation croisee au 
d' amplification (PGR) avec par exexplo des sequences 
presences chez des mycobacter ies r. • appartenant pas au 
complexe de Mycobacterium tuberculosis. Les sondes 
nucleotidiques scion > -invention hybrident specif iquemcnt 
avec une molecule d ' ADN' cu d'ARK de pc.ynucleot ide 3 elon 
1' invention, dans des conditions :i • hvbr : dat ion de forte 
strlngence relies qu , donnees sous i orin , d'e>:e-p!,. 
prece dominant: . 



Les sequencer non rr.m 
^::'cclemcn ? : comma <;o:iri»»N, 
a^a^ : a 1 'jrnent. marouaea car 



n uorcsceino) pour obt.cni r 
r.r.iv.bro'js-ir, app: i car inns. 



; pauva a*, of » 

": ° :: ias. aaquaaces a ,:. 

(1 : a : : rwa. ; ; { K :^ 

' ; • - : • * - : aaaa - dasoxya: id: :;a 

' :; a'. :1 ; sable- oca: a 
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Dans cc dernier cas, on pound aussi uuhser 1 1 une 
des methodes de niarquage decntes dans les brevets FR 2 A27 
956 et FR 2 518 755. La technique d • hybndat ion peut etre 
realisee de manieres diverses {Matthews et al . , 1988). La 
rnethode la plus g£n6rale consiste a immobiliser 1 ' acide 
nucleique extrait des cellules de mycobactdries sur un 
support (tel que nitrocellulose, nylon, polystyrene) et a 
incuber, dans des conditions bien definies, l'acidc 
nucleique cible immobile avec la sonde. Apres 
1 'hybridation, 1'cxcc-s d„ sonde est elimine et les 
molecules hybrides formees sont detectees par la rnethode 
appropriee (mesure de la radioact ivite , de la fluorescence 
ou de I'activite enzymatrque iiee a la sonde). 



Avantageusemcnt , les sondes nuel eot idiques marquees 
selon 1' invention peuvent avoir une structure* telle 
qu'elles rendent possible une amplification du signal 
radioactif ou non - radioact i f . Un systeme d ' ampli f icat ion 
repondant a la definition ci-dessus comnrendru des sondes 
20 de detection sous la for:ne d ' un ADN ranifie, branch* 
(branched DNA» ) telles que celies dc-rites par Urdea et 
al. en 1991. Selon cette technique, ou utiiiccra avanti- 
geusemeut piusieurs types de sondes nc tarr.merU un- sonde 
capture, afin d ' immobi 1 i ser ] ' ADN ou 1 ' ARM cible 
25 supper^, *-m_ une sonde de auLectiou V, 



ae 

ur un 

" uu- u. detection 
LO - :i AI;r; branch** present*:;: u;, structure rami £ id' 



b'ADN' branci 



oi 



^r 



O ^ 1 



:uies de Pfi^phn'asp „i.caiino. Puis I'activite de cer 
10 PnZy ' n,i est :tu;;e e:i ^'idence gr5,;.: a :,r. subs' rati chitni- 
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sur un support et sert a capturer par hybridation cpeci- 
fique I'acide nucleique cible obtcnu a partir de l'echan- 
tillon biologique a tester. Si necessaire, le support 
solide est s£par£ de 1 ' echant illon et le duplex forme entre 
la sonde de capture et I'acide nucl6ique cible est ensuite 
ddtccte grace a une seconde sonde, dito «sonde de 
detections marquee par un Element facilemerit detectable. 

Les fragments ol igonucl6ot idiques peuvent etre obtenus 
a partii deb sequences seion I 1 invention, par coupure avec 
des enzymes de restriction, ou par synthese chimique selon 
les methodes classiqucs, par exenple selon la methode 
decrite dans le brevet europeen N° EP-030b^29 (Miilipore 
Corporation) ou encore par d'autres precedes. 

Un mode de preparation approprie des acides nucleiques 
de 1' invention comportant au maximum 200 nucleotides (ou 
200 pb s'il s'agit d'acides nucleiques bi catena ires ) 
comprend les etapes suivantes : 

- la synthese d 1 ADN en utilisant la methode automatisee des 
bet a -cya net hyl phosphor amidite deer i te en 1980, 

- le clonage des acides nucleiques ain.si obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 
par hybridation avec une sonde aporopnee. 

Un mode de preparation, par voie chimique, d'acides 
riuo : e j que.u seion invention de longueur surer i eur*.? a 200 
nucleotides (ou 200 pb lorsqu ' i 1 s'agit rl'acides nucleiques 
bicat ena i re S ) ,• c:s:e e:r:i les etapes suivantes : 

pourvus a leur extren:ite de sites de- restrictions 
ml Cf eients, dont les sequences son- -empatibies avec 
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Les sondes nuc leot i d i ques utilisees pour la 
recuperaLion des acides nucleiques rechcrches dans les 
procedes gug -ment lonnes , sonr. constitutes gen<5 ralemen t dc 8 
a 200 nucleotides de la sequence dc polypeptide selon 
1' invention et sont susceptibles de n'hybrider avec 1 • acide 
nucleique recherche dans les conditions d 1 hybridation 
definies prec6demment . La synthase de ces sondes peut etre 
erfectuee selon la methods auto:natisee des beta 
cyanethylphosphoramidites decnte en 190C. 

Les sondes oligonucleot idiques selon 1 ' invention 
peuvent etre mises en oeuvro an s^in d'un dispositif de 
detection eomprenant uno banque ma t r i c ie 1 1 e 

^'oligonucleotides. Un exeniple de realisation d • une telle 
oanque matricielle peur eonsiste> en une matrice 
^'oligonucleotides sondes fixes sur un support, la sequence 
de chaque sonde d 1 une longueur dormee etant situec en 
decalage d 1 une ou plusieurs rases oar rapport a la sonde 
precedente, chacune des sondes 
etant ains: cornpl ement a i re d 1 u 
L'ADN cu I'ARN ciblc a delec.-;- > 
■z o n nue e t a n r. fixe e e n u t • • 



1 'arrangement matriciel 
sequence distincte de 
• • 1 • u • ' sonde de sequence 
Mo:; predetermine'.: da 



support . La sequence 
3 vant ageusement marque- 1 
rad i oa;". t i ve;re:it . Lorsque 1 
on contact ave:: ie dispos; 
:iy:;r;d-s a v 1-s sondes 



: l s i 



d'eliminer les hybr ides son- 
p as parfaitement c o n c 1 e m • . 



"'St;e: peut 
.'^ent ou 
* r r • es* 

■' \ >''-•>. a i r<_ 
: : 1 a v a q e , : 
sible qui n<. 
u fait d' 
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Une alternative a 1 • utilisation d • une sequence cible 
marquee peut consister en 1 ■ ut ilisat ion d < un support: 
permettant: une detection « bioelcct ronique » de 

1 'hybridation de la sequence cible sur les sondes du 
5 support matnce, lorsque que ledit support est constitue ou 
comprend un matenau capable d'agir, par temple, en tant 
que donncur d 'electrons aux positions de la matnce 
auxquelles un bybnde a ete forme - Un tei matenau donncur 
d' electron est par example de 1 < or . La detection de la 
" sequence nuclei- i d i que de I ' AC/,' ou AR\' ^ble est alors 
determinee par un dispositif e iect. ron : que . 



Un exemple de realisation d'ar; hioca P Leur ( tel que 
defini ci dessus, est dccrii dans la demande de brever 
europeen N° EP-0721 016 au no:, de Aftymax technologies N . V . 
ou encore dans le brevet a:nerica::i N° US 5.202.23 1 au nom 
de Drinana c . 

L' invention a aussi pou: ohrjet ies polynucleotides 
hybrides resultant : 



- so it de la format ion d 1 urv 
ou un ADD ( A Dr.* neaoniq- 
ec han 1 1 1 1 on bioloqiquo avev 

1 1 invent ion . 

- s o : t d e la f c r n va 1 1 c n d ' u n * 

ou un ad:: ' ad:; , 



■ b y b n de entre un ARN 
provenant d ' un 
1 'i -i-'ie amorce so; on 



mo .cci 



D i r AD No an e-is d*- 
iun> molecule d 1 ADD obtcnu 
-ype t ransc: r i pt ase :nv*e: 

une molecule 



a ' 



nvc r i 



"o r i:re ii * 



ntre un ARN 



; ve riant 



■a un 
iciue 



a : s a n 



une eino/r 



oa : 



' Aider. 
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sequence nuclcot idique SEQ ID N°l ou un fragment de celle- 



ci 



Un autre objet de la presents invention est un vecteur 
pour le clonage, 1 'expression et/ou 1' insertion d ' une 
sequence, caract6ris6 en ce qu • i ] comprend une sequence 
nucleotidique de polynucleotide selon 1' invention en un 
site non essentiel pour sa replication, le cas echeant sous 
le controle d'diements de regulation susceptibles 
d' intervenir dans 1 'expression du polypeptide DP428, chez 
u n n o ti g dctz.crrrii.nG 

Des . vecteur, particular- sor.t par exemple des 
plasmides, des 'phages, des confides, des phagenudes, des 
YAC . 

Ces vecteurs sont utiles pour transformer des cellules 
notes afin de doner ou d'exprimer les sequences 
nucleotidiques de 1' invention. 

I,' invention comprend egalement les cellules botes 
transformees par un vecteur selon i 1 i rivent i on . 

De preference, les cellules hoi.es sont transforms 

dans d e conditio n s p g r rr, e t. : .ant 
polypeptide recombinant: sclcn 1 ' ;.:o/e:c i 



nvGiiLion es:. la 



soucne E. call t raris f ornuV* 



p a v o Xj . a a : - 1 • * c P P 4 I 



^ atj*ooi 



anvier 1 ; - a 7 u i ,« ~r-j~v f.-^.i- ■ , > ■ o * - n - r 



riouL 19 98 a la CNCX aoaa 

: : e a 

de m. tuberculosis, M.boiMs - m, M.n/ri cinu::; noaaedanr 



>° 1-206? era une my cob a c v. e r : - appartcnaiP: a un- s^u; 
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produire in vitro un polypeptide selon 1 1 invent: ion , 
notamment le polypeptide DP428. Ledit polypeptide pourra 
etre fixe sur une microplaque pour developper un test 
sSrologique destin^ a rechercher, danc un but de 
5 diagnostic, les anticorps s P 6cifiques chez les patients 
atteints de tuberculosa 

Ainsi, la presente invention concerne un procedo de 
preparation d'un polypeptide, caractenno en ce qu'il met 
10 en oeuvrP un vectcur ,elon J ' invention. Plus 
particulierement: 1' invention concerne un precede de 
preparation d'un polypeptide de i 'invention comprenant les 
etapes suivantes : 

- le cas echeant, 1 1 arrpl i f icat ion prealable suivarit la 
15 technique PCR de la quantite de sequences de nucleotides 
codant pour ledit polypeptide a 1'aide de deux amorces 
d'ADN choisies de maniere a ce que 1 ' une de ces amorces 
soit identique aux 10 a 25 premiers nucleotides de 1 
sequence nucleot idique codant pour ledit polypeptide, 
20 tandis que 1 ' autre amorce est conp 1 emeri t a i re des 10 fi 2 b 
derniers nucleotides (cu s' hybrids avec ces 10 a 2 b 
dormers nucleotides) do lad:.:- sequence nucl eot idique , ou 
i nversenient de maniere a ce au" 1 1 - m e d- > 
identique aux 10 a 2b dernier-; nucleotides de ladite 
25 sequence, tandis que l auti, imorc- est oompi ernes t a i >-.- des 
:o ^ : — premiers nucleotides -.on s'uvbud 



a 



avec 



su de 1 - mt r:T.::r :cs : 

ampli:. iees dans un ve-r. eur : : r 

- la mise en culture, dans 



s i o i 

ot a : ri- 
nses a ins 



r.iiieu de cult life approprie, 
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L' invention a aussi pour objer un polypeptide 
susceptible d'etre obtenu par un procede de 1 ' invention tel 
que decrit pr§c£demment . 

Les peptides selon 1' invention peuvent £galement etre 
prepares par les techniques classiques, dans le domain- de 
la synthese des peptides. Cette synchose peut etre realised 
en solution homoyene ou en phase solide. 

Par exemple, on aura recours a la technique de 
synthese en solution ho;:ioqe i; , decrit e par Houbenweyl en 
1974 . 



Cette methode de synthes- consiste a condenser 
successivemcnt deux-a-deux les am i noacy les successifs dans 
l'ordre requis, ou a condenser des urrunoacyies et des 
fragments prealablement formes et con tenant deja plusieurs 
ammoacyles dans l'ordre approcne, ou encore plusieurs 
fragments prealablement aim;: prepares, etant eutendu que 
I'on aura eu som proieaer au prt'-alable toutes les 

fonctions react: ves portees par r, = an; noacy les cu 
fragments, a 1 'exception uV ; : :. ••. ; .; a^mes de 1 1 un ev. 
carboxyles de 1 1 autre :. >•.. V ; ver.-e. , cu; do : v ,. r . 
normalement mtervemr dans . :i : = jl -\^. i or. des liaisons 
peptidiques , notamment acre;; a-: : vat ion de la fonc^in- 
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desirce ct ainsi de suite, de proche en proche, jusqu'a 

l'acide amine N- terminal . 

Scion une autre technique preferee de 1 ■ invention, on 

a recours a cclle decrite par McrriCield. 

Pour fabriquer une chaine peptidique selon le proedde 
de Merrifield, on a recours a une resine polymcre tres 
poreuse, sur laquelle on fixe le premier acide amine C- 
terminal de la chaine. Cec acide amine est fixe sur la 
resine par 1 ' intermediate de son groupe carboxylique et sa 
fonction amine est protegee, uar eve^ P le par le groupe t- 
butyloxycarbonyle . 

Lorsque le premier acide amine C terminal est a.ins: 
fixe sur ia resine, on enleve le groupe protecteur de la 
fonction amine en lavar.t la resine avec un acide. 

Dans le cas on le groupe protecteur de ia fonction 

amine est le groupe t-butyioxycarbeny ■ o , il peut etre 

elimme par traitener.t rie 1,, resine a l'aide d'acide 
t r i f 1 uornace 1 1 que . 



On couple ensuite le deuxiem-' 
Je serrond ammoacyje de la sequeno- recherchee , a partir du 
^ Gidu ^ninoacyle ('-terminal sur la fonction amine 

cieprotegee du premier acide «unin<'> 
chaine . Do prof^reiK^' , ; , t f ee" 1 
l " * a^ire- es\ , : ve- . . 

prar.oqeV, par exennle car le v. Pep- 



ae amine qu: foueut 



>: V- ~ cie ::e i^e x i e 



■:yca rbony 1 < 



On obticnt, a ins: ]. ; 



a pT*-i: if.ro part, io de . a cdriirie 
pert idi qu- : '-ehei chee , aa ; • — T - ^ 
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On fixe ainsi, les uas apres ley autre;;, les acides 
amines qui vont constiLuer la chaine pcptidiquc sur le 
groupe amine chaque £ois deprotege nu pieulable dc la 
portion de la chaine pepf.idique deja formec, et qui er.t 
rattach<§e a la r6sine. 

Lorsque la totality de la chaine peptidique desiree 
est rormee, on filimine les groupes protecteurs des 
differents acides amines constituent, la chaine peptidique 
et on detache le peptide de la resine, par exemple a 1'aide 

H ' i Hp f 



,r^,^^; ~ 



De maniere pre f erent i e 1 le , lesdirs polypeptides 
susceptibles d'etre obtenus par en precede de 1 1 invent ion 
tcl que deer it precedemment comprendront une region exposee 
15 au solvant et auront une longueur d'au moms 20 acides 
amines . 



l nven t i an , 



Scion un autre mode de realisation de 
lesdits polypeptides sont specif iques do mycobacteria du 
c omp 1 e xe Mycoba cteri urn t ube r cu J os i s 
rcconnus par d*_ 



- ne sont done pas 
anticorps specit.iques d'awMes proteiries 



nycobact eries . 



invention est en outre r 
ny brides pre sen tan* c u; me in 
1 1 : re/ent. ion et une sequence d 1 

qu'i?, est susceptible d 1 : ndn : : - 
eel iui a ire . 



/e a des polypeptides 
pe I ypept i d.-- ; ■ or< 
' VP'T' i'Jo susceptible 

■ j'-'i. ique est t e ± 
epoirse humoral e et A.r.; 
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Ces molecules hybrids peuvent etre constituees on 
partie d ' une molecule porteuse de polypeptide selon 
1' invention associee a une partie, en particular un 
epitope de la toxine diphtenque, la toxine t^tanique, un 
antigene de surface du virus de 1 'hepatite B (brevet FR 79 
21811), 1 -antigene VPl du virus de la poliomyeUite ou toute 
autre toxine ou antigene viral ou bact£nen . 



15 



Avantageusement, ledit determinant antigenique 
correspond a un detei ;i:nid;iL antigenique de proteines 
immunogenes de 45/47 kD de M. tuberculosis (demande 
Internationale PCT/FR 96/0166}, ou encore so 1 ec t lonnecs par 
exemple parmi E8AT6 (Harboe et al . , 1996 , Andersen et al . , 
1995, et Soreusen et al . , 1995) et DFS (PCT/FR 97/00923,' 
Gicquel et al . ) . 



Un antigene viral, tel que defim ci-dessus, sera 
preferentiellement une proline de surface ou d'enveloppe 
d ' Un VirUS de hepatite, par exemple la proteme de 
2<) surfac - dc 1' hepatite B sous 1 - une de ses formes s, S - 
preS], S-preS2 ou S -preS2 - pr ' " 
virus de 1 'hepatite A, ou d'u.u- hepatite 
qu'un virus de 1' hepatite t\ i-; ou delta. 



1 ou encore une proteine d 1 u; 



-A, non-B 



na r * i --u i . 



ant A r;e:> 



te . 



o 'l -I ij 1 >3 .] t 



>3 74 00 1 5i : , et en pur 
;() proteine select! onnee oar;-:. 



i ou ; i- 



ton* 



<< < - * 1 orevet. 
ou virus ;<:v- 



pa r t i e 



: une 



q c i q , pol, u ?.. 1 f o u e n v d r 
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d'obtention de genes codant noui aer, protcine:; de fusion 
decrite par Mint on en 198'! . 

Lesdits polynucleotides hybridan codant pour un 
polypeptide hybride ainsi que los polypeptides hybridcs 
selon 1' invention caracterisos on ce qu'il s'agit de 
procaines recombinants obtenues par 1 'expression desdits 
polynucleotides hybrides. font. eqaletr.ent partic de 
1 ' invention. 



15 



20 



Los polypeptides so lor. 1 ■ invention peuvent 

avantageusenent etre mis en ocuvr, dans un precede pour la 
detection in vitro d<anticor P s dingos centre lesdits 
polypeptides, notamment ie polypeptide DP4 28 et 



d'anticorps dinges contre u: 
My coba c ten u m t ubercul os is, dan s 
(tissu ou fluide biologique) so: 
ce procede comprenant la :nise e:: 
biologique avec un po] ynen t i ■-':>■ < 
condit ions permettant une reu .t : 
entre ledr. polypeptide et : .-s 
presents dans 1 ' ochari t : 1 1 e; . : 
evidence in vj tre des 
even: ue 1 1 ett.ent formes . 



ains i 

baste rie du complexe 
un echant i lion biologiqU^- 



■r-f'pt ible 

ont ac t 
f '. ■ 1 o : i 

n lHT.u; 



d ex* 



oe les contcnir, 
de cet echant i lion 
invention dans des 
^dogique m vitro 
r : ■ a e v en t u e 1 1 e trie : i f 
f - j n :ni se e r; 
^•><- ; - g>u;e -ant i corps 



et a vast ageusenent e t : e : a >-ui ■ ■. 
ia det.ee" a ' une infection ::ar 

Myccb.ict.oriun: tuhcrcu J as : s : , : . 



: is* >o i * 

:r. a m::'. ;. Lore 



du ccir.pi- 
r a s 'i s i ; r 
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a) preparation d'un echantillon biologique contonant des 
cellules dudit mammifere plus part icul lercMnent des cellules 
du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ■ 

b) incubation de 1 • echant i 1 Ion biologique de l'6tape a) 
avec un polypeptide selon 1' invention; 

c) detection d ■ une reaction cellulaire indiquant une 
sensibilization preamble du mammifere audit polypeptide 
comrre^ par exemple la proliferation cellulaire et/ou la 
"ynthSec dc prctemes teller, que 1' interferon gamma. 

La proliferation cellulaire pourra etre mesuree, par 
exenple par incorporation de 'H-Th-midirie 



Font egalement partie de ] 'invention, les precedes de 
detection d ■ une reaction d- hypersensibilite retardee (DTH) , 
caractenses en ce qu-ils rnettent en oeuvre un polypeptide 

selon 1 ' invention. 

^ preference, 1 • 6 chant; : \\ on o:ologicue est constat^ 
par un f.luide, par exemple un neru-i hur.air: 
sang, des biopsies, le iiauiu- • , , r ■ 
iiquidc pleural . 

Toute procedure class :qu- r>>u* 

DOU!/ I"e f ": ! t t.:*i>- linn ♦- ^ ' , , 



; ciruna. , du 
'i I veo 1 aire on 1 e 
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V) 



- depot de quantites determines d'unc composition 
polypeptidique .-.elon i' invention dans les puks d ■ une 
plaque de microtitration, 

- introduction dans lesdits puits de dilutions croissantes 
da serum, ou d ■ echant i 1 Ion biologique autre tel que defini 
precedemment , devant etre analyse, 

- incubation de la microplaque, 

- introduction dans les puits de la P l aque do 
microtitration d'anticorps marques diriges contra des 
immunoglobulins humaines n, anisic.,, 1c- marquagc de re, 
anticorps ayant ete realise a 1-aide d'une enzyme 
selectionnee parmi cellcs qui sonr capables d- hydrolyser ^ 
substrat cn modifiant 1- absorption des radiations de c - 
dernier, au moins a une longueur d ' ond, determinee, par 
exemple a 5S0 nn, 

- detection, en comparison avec ur. temoin de controle, de 
la quantite de substrat hydrolyse. 

I,' invention concerne egaiemer.t un r.ecessairc ou ki* 

pour le diagnostic in vitro -j ' une mi ectior. pa, une 
mycobacteria appartcnant a-, ,-^.plex, Mycobacteria:* 

tuberculosis , corr.prenar.r. : 

- un polypeptide selun 1 • i nvent ion , 

- le cas echeanr. les react if. s pour la const. : tut icr 
-ilicu prop ice a In je act ion 1 rnmunc : ogiqu^ ou <^,-,,,; r, 

1 W4 - La,lL '.*-'L.ect ic:: aos complexes 

artiaeno Qn'c-on;:' ; > : • • • • - ■ 

" ■* ; ieact:o:; ; oqiau" 

" : " - ' octant : 1 ion ccoioqiaue , e t 

la mise cn evidence ;n ei^rc aes iexes , ::li ^ ;n ,. 

ant: i corps event uel leinent forme:; r-o- -.-'-»■.. : 
eg.-ii^inenf ncrtor n:i m-i >-.-, .r,- > ... 
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- le cas echeant, un echantillon biologique de reference 
(Lemom positif) contenant une quantue predetermine 
d'anticorps reconnus par un polypeptide selon 1 • invention . 

Les polypeptides selon !■ invention permettent de 

preparer des anticorps monoclonaux ou polyclonaux 

caracteriseo cn ce qu'ils reconnaissent speci f iquement les 

polypeptides selon !■ invention. Les anticorps monoclonaux 

pourront avantageusement etre prepares a partir 

d'hybndomes selon la technique decree pai Ko nier et 

Milstem en 1975. Les anticorps polyclonaux pourront etre 

prepares, par exemple par immunisation d - un animal er 

particular une souns, avec un polypeptide selon 

1' invention associe a un adjuvant de la reponse 

immumtaire, puis purification des anticorps np6cifique, 

contenus dans le serum des animaux immunises sur une 

colonne d'affinite sur laquelle a prea 1 ablement ete fixe l e 

polypeptide ayant servi d'antigene. Les anticorps 

polyclonaux selon 1" invention peuvent aussi etre prepares 

par purification sur une colonne ri'affinite, sur laquelle 1 

prealablement etc immobilise un polypeptide s <>lor 

1' invention, des anticorps contenus dans le S o ru ^ dn 

patients mtectes par une mycobacteria 

preferentiellement une bacte-i« anr.^ n pn.m- 

-i^.n.^i^ appar tenant au complexe 

Mycobacterium tubcrcul or, i ■, . 



--'invention a .' ; i,il»x»r.- r .~,-.- ^- n -i r .. ; . 

■ i-orps xonr 

Pr;lyCl ° naUX ° U lcur£ ; f"--nts, ou anticorps 

:n:r " r: ^ :; - Carac " qu'ii., sonr capables do 

rccor.naitro specif i auemen: ^ ; ^. 
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sondes nucleiques de 1' invention toi qU 'un .arouage de type 
en/.ymatique, fluorescent ou radioact i f . 



L- invention vise en outre un procede pour la detection 
5 specif ique de la presence d ■ un antigene d'une mycobacteria 
et prSffirentiellement un bactdrie du co.plexe Mycobzcteriun, 
tuberculosis dans un echantillon bi.logique, caracter.se en 
ce qu'il comprend les etapes auivantes : 



!() 



S ) Mi 



cont act de 1 ' e~h > -i t - ; ' - ,-, u ; * 

e^na.a. ; tl ., n b:o.ocjique (tissu ou 



individu avec 



un 



fluide biologique) preleve ch<. 

anticorps mono ou polyclonal ,el,, :. anven , ion dans d£r . 
conditions permettant une reaction im-nunoloqique in vitro 
entre lesdits anticorps et les polypeptides specif iques des 
mycobactfir.es et pref erentiel le.ent. de, bacteries du 
cornplexe de Mycobacteria tuberculosis evencuellement 
presents dans 1 ' echantillon biologique, 

b) Mise en evidence du complex, antigone - ant icorpo forme. 



20 Ent.rp egalenier/: dans !<• - i p 

necessairc ou kit pour le :i:acrro 
e c h a n t i 1 1 o r: b i o 1 o y i q u e , d e 
-ycobdcteries des mycobact.er i 
bactcrien appartonan: an 

?b Luberruloyiop de preference 

- un anticorps po". y u I on a : . 

- eoheanr marque; 

- le car; dcheant, un reuctif y 
^ p ropier- a :.a real i sat 10 

- 1 - no r;oo; 



i r- i 



f --e 1 ' invention, un 
- '-'^ 1 1 o ; v na o sur un 
prtnsor.. -e ric coucher de 
■ f ~ p re f c r e n 1 1 e 1 1 erne n t de r , 
: 11 >; ' " ' : * * i\V o cba c f; e r i a' 
^ : ■ caracteris>- en 

-ooruii s-M'^i: 1 ■ invention, 

- 1 const i Tar- i on du ::ri i en 
: " : " ;::: ' j ''-que; 
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- lc. cas echeant, des reactifs pour effectuer la lyse des 
cellules de 1 ' echant i 1 Ion teste . 

La prescnte invention a egalement pour objet un 
precede de detection et d ■ ident: £ ication rapide des 
mycobacterias et pref erent lei lement des bacter.es de M . 
tuberculosis dans un echantillon biologique. caractense 
cn ce qu'il comporte les etapes suivantes : 

*> Isolement de 1 ' ADN' a partir de 1 • echant i 1 Ion 

bl0lngi - 5 analyser, ou obtention d'un ADNc a partir de 
l'ARN de 1 'echantillon biologique ; 
b) Amplification specif ique de 1 ' ADN' des mycobactenes et 
preferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis a 1'aidc d'an.orces se l on 
l- s 1 ' invention; 

O Analyse des produits d 1 amplification. 

Le produits amplification peuve,t etre analyses par 
differontes methodes . 

Deux methodes d' analyse prr/ i ,w i m f Kn ^ , 

/ -w. .^wwe^o u tit re d'exenpie 

ci-dessous : 

- Analyse elect rophor L i que , :! gel d^aros- d- 

proauits ^amplification. :,, presence ci • un fragment d ' HBN 

migrant a l'endroit attend'.. suc >a A>-,. - n .« -o^h-^. 

analyse conteriait d- ''A^n ■ ■ 

; '•' 1 - cippart. enarn. au 

corr.pl exe tuhert-i: ■ ncjirj 



u — ' :3a -' u:; '- -'^ade liucituuu- solo:: 
sonde sem avantiageuGenierit: :: ; (1 v n ^. 



ybr : : u 1 1 on to] e -u 1 

nveut ion . Cet te 
;n elemer.v non 
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Un autre precede de la presente invention permet la 
detection d'une infection par une mycobacterie et 
pr«f«rentielle«nent une bacterie du complexe Mycobacterium 
tuberculosis dans un mammifere. Ce procede comprend les 
etapes suivantes : 

a) preparation d ' un echantillon biologique contcnan: des 
cellules dudit mammifere plus particulierement des pilules 
du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 ■ echant i 1 Ion biologique de l'dtape a ) avec 
un polypeptide colon 1 ' invent ion ; 

Odetection d'une reaction cellulaire indiquant une 
sensibilisation prealable du mamm fere audit polypeptide 
notamment la proliferation cellulaire et/ou la synthese de ' 
proteines telles que 1' interferon gamma; 

d) detection d'une reaction d ■ hypersensibilitfi ret.ardee ou 
dc sensibilisation du mammifere audit polypeptide. 

Cette methode de d»t<^- vn- - . 

u-l._„_o.. est une metnode 

intraderraique, qui est deer:;,, pur cxemple par M. J. r, 
et al. (1988) Infection and Immunity, GG(7) : 3454-3456 



iay 



C O I "; s i y 1 n o : ; I i ' 1 



appar t cnant au com-c o; 



Un aur.ro but <]>-> la present-: 
precede pour la detect: or 
u r e f e r ^ n rini a > > <- . » -■ 

J ^ ' — "' Jk aans un echantillon biolog: qU e, 
caracteirse en ce qu'il comprend les etapes suivantes : 

a) Mioc en contact- d ' un^ <-o^Ho * ■ 3 - 

' ' ,Ji,u - — ^^uU^ioo': ^clique se^ c-> 

I 'invent ion a^ .^i,-,,^- , i i, * ■ . 

~ 1 — — > : "■• ■-■.?*qu^, ..'Ab;; ccntenu 

dans I 1 echantillon • 
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preferentiellement des bacter.es du complexe Mycobacterium 

tuberculosis ; 

b) Detection de 1 ■ hybride form6 ontre l a sonde 
oligonucleotidique et 1 ' ADN de 1 • echanti lion biologique. 

L' invention vise egalement un precede oour la detect -on 
des mycobacteries et preferentiellement des bactenes 
appartenanr. au complexe Mycobacterium tuberculosis dans un 
echantillon biologique, caracter.se en ce qu'U comorend 

1 f . 



les ctapuG suivantes 



a) Mxse en contact d • une sonde oligonucleotidique selon 
1' invention immobi I i see sur un support, 3vec un 
echantillon biologique, 1 ■ ADN de 1 • echant i 1 Ion biologique 
ayant, le cas echeant , ete prealablement rendu accessible a 
1' hybridation, dans des conditions permettant 1 • hybridat ion 
de ladite sonde a 1 ' ADN des mycobacteries et 
preferentiellement des bactenes du complexe Mycobacteria 
tuberculosis ; 

b) Mise en contact de 1 'hybride forme entre ladite sonde 
oligonucleotidique immobiiisee sur ur. support et 1 • ADN 
zonter.u dans 1 'echantillon biologique, le cas echear.t am- 
elimination de 1 ' ADN de 1 - echant U Ion biologic- r ■ ayant 

paS hybrid6 avec la ^nde, avec une sonde 
oligonucleotidique marque^- selon 1 1 i nvent l on 

Solon u:: mac de rea ] i ™ • lfj:i avanta^eux du proc-1' .■>. 
^ ecu io:i r i.r. ; p:. eoederonenL , co I n i - o ; c ~*- ■-■ i * \^ f r i " 1 
que, prealablement a i • etape 1 1 ADN do 1 ■ ecnant 1 1 1 n, 

biologique est prealablement amplify a 1'aide d • un couple 

Mi d'a^oru-^ selon ■ 1 i nvenL ion . 
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Mycobacterium tuberculosis dans un ochantHlon biologique, 
caracterise en cc qu'rl comprend l es etapcs suivantes : 

a) Mise en contact: de 1 • fichant il Ion biologique avec un 
couple d'amorces selon ^invention, 1 ' ADN contenu dans 
l'6chantillon ayant 6t6 , le cas , ch , an ^ pr6alablemenr 
rendu accessible a 1 ■ hybridat ion, dans des conditions 
permettant une hybridation dosdues a.orces a 1 ■ ADN de^ 
mycobacterias et pref eren t i e 1 lement des bactenes du 
cornplPvn Mycobacterium tuberculosis- 



b) Amplification de I ' ADN 
preferentie.1 ] ement d r une bactene 
t uberculosis ; 



■-'Line mycobaclerie et - 
du coir.pl exe Mycobacterium 



c) mise en evidence de l'aT.phfin^-- - r 

pKtKailu " fragments d • ADN 

correspondant au fragment" -ncad^ n--- l — 

^ P^J- ies amorce 

exemplc par 61ect rophorese sur a-;. cu a-; 
ol iqonucleotidique selon inversion. 



par 

yen d'une sonde 



b' invention a aussi poe: 
detection de la presence 
preferentiellement des bactenes 
Mycobacterium tubercul < \y j s ; 
par deplaeemore de bnu, . ■ ; ; . 
• ; Stapes suivantes : 
."ise en contact- e- L'er.cr.::' 
couples c 1 amorces solo:: 
destmees a 1 ' ampli f i ca t ion de t 
I'ADN conr.enu clans 1 ' echant : .i :. r :; 



appu r tenan 



vent .1 or. 



^recede pour ; cl 
: r ; b a c t e r .i e s e t 
: au complexe de 
* ' c ' :: iol c :: r.:" 
f -:' J ' - 1 "V;:\:e en ] 

J : u' a - iC/ec deux 
spec i f; i querr.es 
i f es c i - des sun , 
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b) amplification do 1 ' ADN des mycobacteria el 
preferentiellement des bactcr.es du complexe Mycobacteria 

tubercuiosis; 

c) mise en Evidence do 1 'amolif ir-irinn ^ r 

umpi 1 1 Kdt ion do fragments d'AON 

c-orrespondant au fragment encadre par i es amorces par 
exemple par filectrophorese sur gel ou au moyen d ■ une sonde 
oligonucleotidique selon 1 1 invention. 



invention concerne aussi u, necessaire ou kir pour- 
la .ice en oeuvre Ju precede ciecnt ci-dessus, destine a la 

detection de la present ,w i 

presence cies mycobacter ies ei 

preferenti.elle.ent des bacter:es du complexe Mycobacceriun, 
tuberculosis dans un echantiiion biologique, caractense en 
ce qu'il cornprend les elements suivants : 

a) Une sonde oligonucleotidique selon 1- invention- 

b) Les reactifs necessaires a mise en Qeu ' vre d , 
reaction d 1 hybndat ion ; 

O Le cas echeant, un couple d'amnrces selon invention 

amsi que les reactifs np^pc ;s , irr - nno 

Lo,SaUCj d une reaction 
■3' amplification de 1 ' ADN ( ADN q^-onvn^- r - i 

^"° ,lllv l a! -- plasrnidique ou 

ADNc) des mycobacterias n\ Pt( 'r^ 0 0 M n , r „ 1( , 

du comp 1 e xe A/ycoiM c l e ri u;;; t ub-r cu / e <; x s 



? r i e s 



L' invention a aussi p-.-- ,-.p jr 
- P° ur - ; i ciet-otioi: de lu r>renerio 
J s-e£erent : el le;ne:^ des ha--/-: ■ 
"ubei-cu i os.i s dans un ecbnr/ 
co qu'il conuueud les elements suiv, 
Une sonde ol igonuc I <V ^ : d i an* 
,n i^Ion 1 ' invert uuu- 



r ^ : - ou necessa i re 
:i " ::i y-obacteries et 



iae ci- caoture, 
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preferentiellement des bacLer.es du complexe Nyrobacceriu* 

tuberculosis . 



L' invention concerne encore un kit ou nficessaire pour 
1- amplification de 1 1 ADN des mycobacceries et 
preferentielle,nent des bacteries du complexe Mycobacteria, 
tuberculosa present dans un dchancillon biclojique, 
caracterise en ce qu'il comprend ies elements suivants : 

a) Un couple d'amorces selon 2 'invention,- 

b) Les reactifs necessaires pour effectuer une reaction 

d ' amplification d'ADN; 

O Eventuellement un composant permettant de verify la 
sequence du fragment amplify, plus particulierernent une 
sonde oligonucleotidique selon l 1 invention. 

Un autre objet de la prescnte invention concerne une 
composition immunogene, caractensee en ce qu'clle comprend 
un pjlypeptide selon 1 1 invention . 

Une autre composition immunogene scion 1' invention es: 
caracterise en ce qu'elie comprend un ou olusi-urs 
polypeptides selon 1' invention et/ou un ou plus^u^ 
polypeptides hybrides selon 



;ition immunsgerie ci-dessa:, dofinie ~ 



l 1 



a ■ un 



'/accm, ^orsqu'e:.]. est presentee eri association a- 
venicule pharmaseut iquement aoc-p table et event ue 1 icine; 
cu plusieurs a i • ;:v.i:,: s d- 11 * - ■ 
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f-uberculose), micro organises inactives (virus de la 
grippe), des exf. raits acellulaires (Bordvtella pertussis 
pour la coqueluche). proteines recombinees (antigene de 
surface du virus de 1'hepatite B) , den polyosxdes 
(pneumocoques) . Des vaccins prepares a partir de peptides 
de synthase ou de micro -organises genfitiquement modifies 
exprimant des antigenes necrologues sont en cour- 
d' experimentation. Plus recemment encore, de, ADN 
plasmidiques recombines portant dos genes codant pour de~ 
antigenes protccteurs on, ote proposes com me strategy 
vaccmale alternative. Ce type de vaccination est realise 
avec: un plasmide particular derivant d ■ un plasmidc de K . 
coU qui ne se rcplique pas in vivo e t qui code 
uniquement pour la proteme vaccmante. Les onncioaux 
composants fonctionnels de ce plas.ide sent : un promo'teur 
fort permettant 1 'expression dans les cellules e.caryotes 

(par exemple celui du CMV) nn c,t-„ ^„ -i 

un slLe dp clonage approprie 
pour inserer l e gene d'interet, unc sequence de 
ternunaison-polyadenylation. une engine de replication 
procaryote pour produire le plas.ide recombme in vitro 
et un marqucur de selection (par exemple U- g * n ,. d „ 
resistance a 1 ■ ampic i 1 1 me i pour faciliter la s^l P ^-, r 
des bacteries qui continent le plasmidc Des animaux ont 
etc immunises en injectant ^implement 1 ' A: 



1 * '-onduit a ■ 'expression d< 



dans 1« muscle. L'ctte 

:a prot6int! vaccinal.. 1:: s:x tu , u 

* T.rr.uni t_a i re : i pa rf ; cu] j o>- ;-},■> t- , T . ,., -j 

"ypc humor a: la.racorps) 

rcponse i mmui; 1 1 a i r o e ^r- H ^ 

° - Wii pn n ci. p aux 

'a ' och:i;quo do vaccina;- 



pi asrr.i diquc ru: 



ellfJ double induct, inn do la 

^vantages; d^ 



ivoc d*> ] 1 

r j : : t 



H u v r i r j n 
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tout ou partie du gene DP4P8. ob ]e t de la presente 
invention conduirait probablement a une ( „ e illeure 
protection contra la tuberculose. Tout ou partic du gene 
DP428, ou tout polynucleotide selon 1' invention, peut etre 
facilement inser6 dans les p i asinides vecteurs vu 
(Montgomery et al, 1993)i pcDNA "5 (Invitrogen R & D 
Systems) ou pcDNAl /Neo Cu-uro^, ou i possedent l es 

caracteristiques n^cessairr^- r^.,>- 

i '^es.aire. pou: une utilisation 

vacc i nale . 



caracterisee en ce 
polypeptides selon 
pol ypep tides hybrides 



L' .invention vise ainsi un varci: 
qu'il comprend un ou plusieurs 
i 1 invention et/ou un ou piusieur 

selon 1' invention te 1 s co r->--;— * * ~ <- ■ 

c l^- pu e, eoemment ne finis en 

association avec un vehicule pharnacouuque.ent compatible 

et, le cas echeant , up, ou pius^urn adjuvants de 

I'immunite appropries. 



L. 1 invention vise auss; 

2u destmee a 1' immunisation 

1'encontre d 1 une infection ti: 
la tuberculose ou 1' hepatite, 
comprend un ou plusieurs ; ; 
preccdemmenv. de finis en as; 

? s p hart n a c e u 1 1 q u e m e n t c o m c a t ^ id • • 
plusieurs adiuvant s de 1 1 1 i — 



eonpos : f - i on vaccinale 
■ it-jir.rr'.' ou 1 1 animal a 
i c r t n e u y i r ale, telle q u e 
i: ir " f -n ce qu 1 e 1 ] e 

opt ides hydrides tels que 
-or; )'.'- • un vehicul*- 



A\'artaoeuserr;-!V , 
entre un polypeptide selon I'mv: 
™ surface de 1 'hepatite B , y t ,. orp 
adn: i n i r; t r ^e v p 0 - 



c' : - ^no hybr: ac 
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moitie de la quantite ponderale de la proteine hybride 
continue dans une dose destine a un patient n'eta.nt pa, 
affecte de troubles du systeme immunitaire. 



De preference, la composition vaccinale sera 
adminxstree a plu.ieurs reprises, de maniere etalee dans le 
temps, par voie mtradermique ou sous -cutanee . A ture 
d'exer, ip lc, trois doses telles que definies ci-dessua seront 
respectivement adnunistrees an patxent au temps to au 
l<) temps to + i m ois et au temps to . 1 an. 

Alternatives, trois doses seront respect ivemenr 
adnunistrees au patxent au te.ps tc, au temps to + ! mols 
et au temps t 0 + & mois . 



» Chez la souris, chez iaqueHe une dose oonderale dc la 

_ compos: tron vaccinale comparable A la dose utilises chez 
1-homme est admin: stree , la reaction anticorps est testee 

par prelevement du serum su^-i -'■nro or (1 a ^ 

ou..., iA ur.e etude de la formation 

d'un complexe entre les arm i corps ores^nt- H*nc i 

^.^^._> uiljl.ils clans le serum et 

- ,/cK -^^iC ( scion les 

techniques uglicUcs. 



invention concern^ e<:a lament uric 



immunogcne caractet isee er; 
25 polynucleotide ou un 

1' invention, en ;if;s ^ 



r a t .i on a 1 



O 1 ; 



• > : u vt*u ^ i.on a oncor 1 pan 
immunisation a I'enconttc d 
■ raI '- ^' que la tuberculosa 



compas i t ion 
qu 'elle cotnprend un 



vaccm dentin^ a 
bast: Or .1 enne ou 
' a : i r a :: r >'> > . 
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90/11092 (Vical inc.) ct egale.enc dans la demand,- 
Internationale N° NO 95/11307 (Institut Pasteur). 

Le polynucleotide constitutif de la composition 
irnmunogene ou de la composition vaccmale selon 1 - invention 
peut etre injecte a -note apres avoir ete couple a des 
compose qui favorisent la penetration de ce polynucleotide 
* i'inter.eur de la cellule ou son transport juoqu'au noyau 
cellulaire. Les conjugues resultants peuvent etre 
encapsules dans des micropart icuios P oly:,ercs, cu.mne decnt 
dans la demande Internationale U° WO 94/27233 <med 1S orb 
Technologies International) 

Selon un autre mode de realisation de la composition 
irnmunogene et/ou vaccmale selon -invention 1 P 
polynucleotide, de preference un ADN , est complex* avec du 

DEAE-dext ran (Paqano et a 1 iq^i 

y<*no e l ai., 1967} ou avec aes proteines 

nucleates (Kaneda et al. ( 1989}, avec dcs llpides (Felgner 
ot al., 1 987) ou encore encapsules dans des liposomes 
(Fraley et al . , 1980} 



Selon encore un autre node d.. realisation avantageux 
de la composition inunurroger.e et/ou vaccmale Be lon 
1' invention, le polynucleotide seln, 1' invention peut etre 
introduit sous la forme d'ur. gel facilitant v,a fransle-io;; 
dans Ins cellules. Ur.f> t- ^ ' .-. -. rir ,. T ,_,,- ; 
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Un ccl vaccin sera avantagcuscment prepare sous la 
forme d • une composition contenant un vecteur selon 
1' invention, plac6e sous le controle d'elements de 
regulation permettant son expression chez 1 ■ homme ou 
- s 1 ' animal . 

Pour realiser un Lei vaccin, le polynucleotide selon 
1' invention est tout d'abord sous-clone dans un vecteur 
d' expression approprie, plus part icul ieremenr. un vecteur 

d'expression conrpnsnt- h^o „;„ , . 

^yiiaiiA ue regulation et 

d'expression rcconnus par les enzymes des cellules 
eucaryotes et contenant cgalement une engine 
replication active chez le, procaryotes, par exemple chez 
f. cold, qui permet son amplification prealable. Puis l e 
plasmide recombinant purifie obtenu est injecte a l'hote, 
par exemple par voie intramusculaire . .* 

On pourra par exemple utilise,-, en tant que vecteur 
d'expression in vrvo de 1'antigene d'mteret, le plasmide 
PCDNA3 ou le plasmide pcDNAl/neo. tous les deux 
commercialises par Invitrogon < R&D Systems, Abingdon 
Royaume-Uni) . On peut aussi utiliser le plasmide VlJns.tPA, 
doc lit par Shiver et al . en 1 9 95 

Un tel vaccin comorendra avantageusement , outr- le 
vecteur recombinant, une solution saline, par exemple une 
solution de chiorurr so-^i— 



par e>:o:up.,! acimin i c L rue par voi- par Altera 
i.nt ramuscu l.airc . 



ou par von 
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echeant, u, ou plus.eurs adjuvants de 1 • lm „unUe 
appropries . 

Un autre aspect porte 3ur une methode de criblage de 

molecules capables d-inhiber la croissance de -nycobact6r.es 

ou le mamtien de mycobacter i es dans un note, caracterisee 

en co que lesd.tes molecules bloquent la synthase ou i a 

fonction des polypeptides codes par une 3§qucncc 

nucleotidique selon Tinupnt-;^ ~. .__ 

" w ^ u v ciL un polynucleotide 

tiel que deer it supra. 

Dans ladite methode de criblage. i C3 molecules peuvent 
ctre des ant i - nessagers ou P euve,t induire la synthase 
d 1 ant i -message rs . 

La presence invention v., eyalement des molecules 
capables d'inhiber la croissanco de mycobacterias ou le 
maintlGn de ™ycobacteries dan, un bote, characterises . r c~ 
que lesdites molecules so;, synthetisees d'apres 
structure de. polypeptide:;; codes par une sequent 

nucleotidique selon 1' invent;.- ni >- , r , _ , 

* P a: un polynucleotide 

tel que QMcrit supra. 

i^'autres carac t e r i s t iau^ 3 „ ri , 

■ ue : ':nvc;r 

■ipparaissont dans les ->:<••• _, ; ., rV ^ 



FIGURES 
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polypeptides codes par la s^tio do- 

r ^-uc aes sequences 

nucleotidiques SEQ ID N°i. 



Figure 2 : 

Illustre la sequence nucleot id ique SEQ id n*2 
correspondant: a la region incluant; le gene codant pour 
le polypeptide DP423 (region soulignSe). Sur cette 
figure one ete pri3 e n compte a la fois ies codons ATG 
illAl . ia ux W w ae id traduction. La figure fait 
apparaitre que le polypeptide DP428 fait probablement 
partie d'un operon comprenaat au moms t.rois genes La 
region doublement encadree i :lc lut probablement les 
regions promotrices. 

La region simplement encadree correspond au motif LPISG 
rapellant le motif LPXTG decrit chez les bacteries a 
Gram positifs comme permettant 1 • ancrage aux 
peptidoglycannes . 

kA__sprLie_d^_JJ^ur e n 3_ : 



La SeriS dc Fi ^ ures 3 represent- la sen*, de socm-nces 
nucleotidiques SFQ ID N°3 correspondant a -insert du 
vecteur P 6D7 (depose a la CNCM sous le K° 1-1814) 
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La serie de Figures 6 : 



La serie de Figures 6 represent la serie de sequences 
nucleotidiques SEQ ID N°6 correspondant a 1 ' insert du 
5 vecteur p2A29 (depos6 a la CNCM sous lc N° 1-1817). 

La s£rie de Figures 7 : 

La serie de Figures 7 represents la serie de sequences 

l*' nucleotide rmp« .qpn m mot ,_ . , . 

-- •■ • —w^opuuuaia c , j. 'insert du 

vecteur p5B5 (depose a la CNCM sous le N° 1-1819). 
La serie de Figures 8 : 

La sene de Figures 8 represente serie de sequences 
15 nucleotidiques SEQ ID N°8 correspondant a 1' insert du 
vecteur plC7 (depose a la CNCM sous le N° 1-1820). 

L-t serie de Fi gu res 9 ■. 

20 La serie de Figures 9 represente la serie de sequences 
nucleotidiques SEQ ID N*9 correspondant a 1 ' insert du 
vecteur P 2D7 (depose a ia CNCM sous le N° 1-1821). 

L a, serie de Fig ures lu : 

L- t serie de Figures 10 represente 
nucleotidiques SEQ ID :;°ir - : i ; ^< ; 
vecteur plB7 (depose a la CN'::-: s- 

V) La ^Grie__do_Fi£LtLVJi«Il : 



a f.Mrie de sequences 
:~i i t n *; a 1 1 i rise r *~ 



serie ae i-ioures :i >r- 0 - „ 

■ -t-* ----^*. . .i .,erie ue s-.iuences 
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La sene de Figures I. represent la sene de sequence, 
nuclgotidiques SEQ ID N°12. 

La s£rie de Fiqu re.q__Tji_ - 

s 

La sene de Figures 13 represents la sene de sequences 
nucl£ot idiqucs SEQ ID N°13. 

La sen e de Fi g ures 14 : 

10 

La sene de Figures 14 represent la sene de sequences 
nucleotides SEQ ID N » 14 ccrrespo.ndant a !■ insert du 
vectenr P 5B5 (depose a la CNCM sous le N ° I-iaig). 



is 



La jenede F 



i gures 1 5 



La sene de Figures 15 represent la sen, de sequences 

2(> nucleotiidiques SEQ ID N 0 1 T; . 



La serie do Fiqure sJL 6 : 

La serie d- Figures 16 rcpresonm l a serie do sequ , nco; 
nucl^or.idique3 SEQ ID N a l.r, 



1,n ser ' ie do P^urcn 17 repres..,ite la sene d-- S( ^, u , ni 
rvucleot id: ques SF.Q n;- M°i7. 
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La sene de Figures 19 represente la ser:e de sequences 
nucleot idiques SEQ ID N°iy. 

■ s s6rie de Figures 20 : 

La sSrie de Figures 20 represente la serie de sequences 
nucleotidiques SEQ ID n-20 correspondam a V insert: du 
vecteur P 2A29 (depose a la CNCM sous le N 0 i-ioi7) 

) 

La seri e de Fia nrrg 21 : 



La serie de Figures 21 repres^nr m -i ™>-- 

n - ^h-^^-i^. f - * a sguu ae sequences 

nucleot idiques SEQ ID N°21. 



La serie Fi gures 22 : 

a serie de sequences 



La serie de Figures 22 represente 1 



nucleotidiques SEQ ID N°22. 
La_ se rie de Fig urf^^ . 

La serie de Figures : 3 representee la ser;e d» sequences 
nucleot idiques SEQ l p ?J°2 3 
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La serio de Figures 7 7 



La serre de Figures 27 represents la o6rie de .sequences 
5 nucleotidiques SEQ ID N°27 correspond.nL a 1 • insert du 
vecteur p5A3 . 



K) 



Figure 2 i 



La sequence d'acides amines (.el In quo define ^ = ^ 
fl3Ure 2 " re P^sente la sequence d'acides amines SEQ ID 
N°28 correspondanL au pol ypepM de 



1 5 Ili^u_r^_2i) : 

La figure 29 represente la sequence nucloot: id i quo SEQ i'd "n° 
29 du gene complet codanr; ; (i croteme NUC2S. 

20 F^nuro 30 : 



iigure 30 represente la s- 
L lu 30 de la prnteme f-: 1 C L i; 

25 Lii_se_rie de Figures 3 1 : 

-.a serie :io Figures 3: : • . 



-a sejrjo__ie_ Figures 32 



La 



es amines Sl 
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La scrie de Figures 33 repre, 
nucleot idiques SEQ ID N°33. 



>cnte la serie de sequences 



La serie de Figures 3/1 : 

La serie de Figures 32 represents la .erie de sequence, 

nucl^otiidiques SEQ ID N°34. 



La scrie de Fi 



gures 3S 



-a GC-ue de Figures 35 repress 
nucl eolidiques SEQ ID N°3(j. 



e J a se 1- .i e de seq 



uences 



La serie de F 



lqures 36 



La serie de Figures 36 represent;- 
nucleotidiques SEQ ID N°36. 



a serie de sequence: 



^ J^e_de__F_i_g 1 1 re s 3 7 _ : 

La sihie de Figures 3^ re; 
nucleotidiques SEQ ID N°3V 



" l -ii'V* 0 d" Figures 38 
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La serie de Figures 40 represent la sene de sequences 
nucleotidiques SEQ ID N°40. 

La se Vie de Fjquren 4 1 - 

La serie de Figures 41 represente la s6ne de seauences 
nucleotidiques SEQ ID N*41 correspondent a 1 • insert du 
vecteur p2D7 (depose a la CNCM sous le N°I-1821). 

La serie de Figures 42 • 

La serie de Figures 42 represpnte 1, r ; h 
nucleotide ques SEQ ID N°42. * * 



La_seri c de Fiq nrpg n 



La serie de Figures 43 reo^s^M^ h c-o V1 . 

ia s^iie ae sequences 

nucleotidiques SEQ ID N°43. 



La serie de Figures 44 



La serie de Fiqun 



■igures 44 represente la sene de sequences 
nucleotidiques SEQ ID N°44. 



i>d se : 



3:.U..L"_ 'ie _F Lqcr_e s 4 r 



^ belie 



,! ' ? ri: ' !Ures 4b represent- ! „ s 6r:o :io sequence. 
nu'jlooL i diqucs GTvQ IH N°<15 
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La serie de Figures 47 represent, la serie dc sequences 
nucleotidiques SEQ ID N°47. 

5 s&r ie de F ig ures 4 6 : 

La fl6 rie de Figures 48 reprosonte la serin de sequences 
nucleotidiques SEQ ID N°48. 

10 La s en^ Hp _Fiqu res 4 9 : 

La serie de Figures 49 represente la serie de sequences 

nucleotidiques SEQ ID N°49. 

is 

LjL_serie de Figures 5 0: 



La serie de Figures 50 represent la serie de sequence, 

nucleotidiques SEQ ID N°50. 

20 



A- la construction pJVED : Pias:„:d navettei pouvar.r ^ 
multiplier chez les mycobacteria axnsi que chez 

2- s E.coli). avec u;i qono w.^,., ^ , . . , 

issu ae i i: JOj i comnv ^'.a: '.7ueu r <-A'.->'^ 



^y::t he t ique . 

B - Sequence de la ]on::;:o- -ntr- r hoA -t i^- 



10 
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portion nt 964 iextrdmite 5' do la sonde) et le 
nucleotide en position nt 123-1 (extreme 3 - de la 

la sequence SEQ id N°l. 



sonde), extremitcs indues, de 



■ S Figures 53 et: 54 : 

Activites Luc et PhoA de M. „,.,..,..„.,.,.., recomblnj!U 
contenant l e pJVRD avcc dl£f( , rem:a fraqmentg 

nucleotidiques comme decnts en exemple. Lgs £ lgurC s 52 

1(1 et: 53 representors l^c >-/ w .,.i.. 

— — om.enu<; pour deux 
experiences distinctes reah^o, lpo 

c.a..o ies memes 

condi t ions . 



1 5 
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f igure 5 5 



Representation de i 1 hyd>~orn — — i> , 

y OMU ' ia '' Uyie et Doolitle) 



de 1 a 



sequence codante du . -, nion 



representation schematique 
immediatement la region 
sequence se t ermine par deux 

ili_gLyxe_5tS_ : 

Represents ion de I'dvdrcor- 
■ a sequence da pel v-o ;; , ; - 

a n i n e s a PQ T P P T ° 3 r 

R i Q'J r e b 7 ; 



. precede 
r ' r : na : '-' ■■y.irophobe . I. a 



* w Pool. it:!- 1 : de 
-'i u " : *' d ' a cider; 
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ligne 1: Marqueur de na Soe moiair^ (Prestained SDS-PAGE 
Standards High Range HIO-RAI),,/ ) 

ligne 2: Extrait bactfirien obtenu par son.catxon de 
bacteries E. col: M15 contenant le plasmide P M1C25 

san3 induction par l'IPTG. 

ligne 3: Extrait bacteiien obtenu par sonicat: 



bacteries E. col i MIS conLoi; ( in 



ion ae 

■ I1,lnL I 1 -' plasmide pMlC2S 
pros 4 neures d' induction par I'IPTG. 



ut naoot_ m,ic1ilo (Prostained SDS-PAGL-: 



Standards Low Range BIO-RAD^J 



B- Western blot d ' un gel semblable gel (acrylarrude 
revele grace a 1-anticorpr, penta-IU, commercialism par la 

societc Quiagen. 



. igne i: represent at ion 
( Prcstaincd SDS - PAG:.-: 

1 gne ;> : c x t ra i t ba l t e r i <; 
b a c Leries E . c o 1 : 



■'■arqu-ur aV :i\a;jGe n:oIa:r- 
La::d ' lrd; " ; M; g^ K^ge iilO-RADvr). 



ontenu pa: sonication d> 
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28400 daltons, correspond a i • exD'-es-i on h,, i. 

f ^'."-""lon ue 1 insert M1C25 

clone dans le vecteur pQE 60 (Qiagena) . 



En ce qui concerne les 16gendes de S autres figures qui 
sent numerous par un caractere alphanumeric, chacune do 
ces autres figures represents J a sequence nucleor- idique ot 
la sequence d'acides amines de sequence SEQ id dont li 
"^rotation est identic au caractere alphanumeric^ de 

- —-^^^.^^o nyuify , 

Les numerations alphanumeriques des f lqure . 
representant les SEQ ID comports un nombre suiv; d , une 
iettre ont les significations suivantes : 

- les numerations alphanumeriques presentant le 

» no,bre concernent une meme familie de sequence rat tales' 1*- 

la sequence de reference SEQ id donr l -, „ - • • - 

v iu uont la nume rota t ion 
presence ce meme nombre et la lettre A ,• 

- les lettres A, B et c pour une «e ^nille de sequence, 
distmguent les trois phases de lecture possibles do \ a 

° se ^ uenco nucleotide quo SEQ ID de reference (A) ; 

- les lettres indexees par ur; m ime (■) - ]arif 



sequence correspond a un fragment do la 



ignifient que la 
quence SEQ ID de 



reference (A) ,- 

\ la D Si9nif - ^ 1 " ^quence correspond a la 

sequence du gene predit par . ... r, | -, 98 . 

^i.aso ou vc v *t- f'» 1, w. »-..>- ■ . . 

a 1 . , 19 9 8 ; 



-'apres Cole el 



VV O 99/09186 



PCT/FR98/0I813 



75 



sequence " D " correspondanto ct pouvan , 6tre en phase ^ 

3 S ^ eUCe " D " Cn — d-erreurs de sequence 
possibles ; 

\ 13 lettre P 9i 9" ifie la sequence correspond A la 

Phase ouverte de lecture contenant la sequence -r» 

correspondante ; 

- la lettre Q si gnif ie quc la s6quence corr d ^ 

sequence contenant les sequence. - F .- ec „ p .; 
correspondanLes . 

En ce qui concernc la faille do sequences SEQ m N o 
4, 1- insert, precedent p ho A conrienc deux fragment, non 
contigus sur le genome, SRQ ID et SEQ ID 4A< Qt ^ 

xssus d .un clonage multiple per:ncttanL llexpre33ion gr 
1'exportation de phoA . Ces deux fragments non contigus, les 

genes et les phases ouvertes dn lec'ure n--i l- 

^ecure qai les contiennent 

d'apres Cole et al i qqr 

ai., 1998, sont important^ pour 

.'exportation d ' un polypeptide antigene ■ 

- les lettre* J , K et L, distmguent les trois phases d, 
lecture possibles de la sequence nucleot i digue , 
correspondante ; 

- la lettre M signxfie que L .sequence corr^.^d ^ a 
sequence predite par Cole et ai., J 998 . con ,, naR . ^ 

sequence SEQ id N° 4 J ; 

y qu - ^ sequence oorresoond i i, 

Phac ° :mv-rt - J. : lectur- rv^_,„. , . , 

' ^ 1 • 1 .'^q-:cnce SI'Q I ; j ;;: 



s e q u e n c 



' f J d u * a £ ^ q u c r i c e c o r r e s ;j n d 
ymer.L clone fusion.-' eve-.: phoA. 
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Materiel et mSthodes 



•< Cultures bactfiriennes, plasmides et ,u Heux de cultures 

E- coli a 6t& cultivfi sur m il 10 u li quido ou BoIid „ Luri? . 
Bertani «LB,. „. sn.eg^s a ete ,ul t iv« our ,nili eu liquide 

M.ddlebroo, 7H9 (Oifcc) addi^onne do dextrose alb„ m _ 

wujo , 0^2 * de yiycorol GL 0 Os °* H,> 

^ cl u,l_, « a- ,ween, ou sur milieu 

solide L. Si necessaire i 'an* L 

rajoute a une concent ra t ion d- /iq/rril - 1. Les clQnes 

bacterids presentant une acuvue PhoA out ete deteVtes 
sur de 1'agar LB contenant d- n _ , 
I* phosphate (X-P, a 40 /ig/rr.l - 1). 

Manipulation d ' ADN et sSauenraae 



L ec manipu] at: iciig d 
20 Southern blot ont eLe 

techniques standard (Sanbrook 
d'ADN double hrun ont e^ 
sequen V age Taq Dye Deoxy 
Biosystems) , dans un System 
- tinier), et apres ^igrati..-:; 

f App] ied R i osys- : 



• f-'s analyses par 
*' ;; f - r * utilisant les 
■ ' : ' q - ■' • L<es sequences 
: aveo un kit de 



"u na t 



-yc 1 e ( Appl led 
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pGEM-iuc et un site de llaison du r . bosome a ,^ 
P»oA a ete am plif i6 a part,,- de pJEmi . Les 
amplifies ont ete coupes avec Patl et ligatures ensemble 
Les oligodfioxynucl^otides utilises son,: les suivants ■ 
PPV . luc . Fw : 5 ' GACTGCTGCAGAAGGAGAAGATCCAAATGG3 ' 
1 uc . Bw : 5 ' GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 • 
pJEH . phoA . Fw .- 5 ' JCGCGGA rCL'GGATACGTAC3 • 
phoA . Bw : s • GACTGCTGCAGTTTATTTCAGCCCCAGAGCG3 • 

Le fragment ainsi obtenu a ete reampi i f eil 
"Client les ol igonucleot i des conple.entaires do se^ 
extremes, coupe avec Kpnl et Notl . ec inc , qr , dans ^ 
coupe avec les me .es enzyme3 . L , • ;J; , ; on r6suUdnto g 

ete elecuoporee dans col, OH5a et M. smcgm atis ,n C 2 155 . 
Un clone «. smegma C is emettant de la luniere et Dresentant 
une activity P HoA a ete selectionne et appele P JV ED /hlaP. 



" AnSerL a ^ rStir6 Cn et la construction 

refermee our elle-menvj, rero.-i • , 



Afin d '°btenir le pJVEn bfC . ; 0 .ultis^o d 



pJVED a . 

clonage a cte 
coupe avec Seal et: Kpnl -n-nm^ n 

' ^ * onlovar.t un (pJVED b i 

ou deux (pJVED c ) nucleotide u- - o , - 

* "' ' — - Apron fiuy ioi. 

cadres de lecture ont pv - : M >-„ , 

1 ' ob -cnus. I,' insert 

amplication er; chaine o;ir 



du pJVED/hcpI© a ete obtenu pa> 
polymerase (ACP) de p^r*:; v-; £ :. 
ut::;mant: des ol igonucleor i des 
- 8 • Ew : ^ * Cri'ACCACr'I'ACT-- T '"A' 

Le produi r d et 
liqatur^ n ' „TVPr.. - 



^ J J 



' < - 5 ' :a n-que;u;o . 

^AA:;dddTCAGTdCGJ 1 

— i- ; - iV '- or. sc<i . 
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multisite do clonage de pJVI- D a . 

Mcsure de l'activite phosphatase alkaline 

La presence d'accivxte est detects par la couleur 
•< bleue des colonies croissant sur un milieu de culture 
covenant la substrat 5 - bromo «_ chloro ,. indolyl 

(XP), puis 1 'activity peut etre rnesuree quantitative^ de 
mamere plus precise de la faccn suivante : 

M. s^atis ont ete cultives dans un rrulieu LB 
m additionnes d„ 0<05V de Tween 8Q ^ ^ 

kanamyClnC (2 ° '^/ml- 1, a .17.C pendant 24 heures 
L'activite de la phosphatase alkaline a eto rnesuree i a ' 
methode de Brockman et Heppel (Brockman et al . , 19S8) dang 
un extrait unique, avec P-mtrophenylphosphate co^e 
substrat de la reaction. La quantite de proteines a ete 
-suree par essai Bio-Rad. L'activite phosphatase alkaline 
est exprimce en unite arbitrage (densite optiquo a 420 nm 
x ug de proteines- l x minutes- 1; 

2<> Mesure de l'activite Iuc:ferase 

M - S ' RC9mCJCiS 0 «.ltiv<S can, un ,:;U:eu LH 

additaonne de 0,05 % de Tween 80 (Aldnch) et de kana.ycin- 

(20 ng/ml- 1) a 37°r nendant "M > r ,,- ...... , 

,< ... i . 0 c .use en r,lein<e 

cro:ssano> exponent lei lc (DO a .... . . 

- — i-w. i ..,0 ent r>-> j , i <■■• 

v! ' 8 ' • Le:j aliquot r, de suspension;; har^ • . ;i:;r . - ; G , . ,,. \ 

brisvemenr. ^ :i::que:; et 1 'extra:: ,■■..■> " x r ; 

pOUt mSSUrer ^tivite de la ^citerese' \~s ^ i ' ^ 
1 'extrait sonique ont ete melanges av.-c: 100 ,,1 do aubstra ; 
*' l5;yf,tf?nui d ' cssa; iuciferaso r rt)RCga , 

un .luminometre of la l...^i;.>- r . - ' 
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Construction dc banques genomiques de M . tuberculosis ct 

de bovia-BCG 



Les banques ont ete obtenues en utilisant 
es^entiellement pJVED a , b , c precedemment decrits. 

Preparation de macrophages issus de la moelle os.euse et 
infection par M . smegmatiB recombinants 

10 

Les macrophages issus de la moelle osseuse ont ete 
Prepares c«c decrits par Lang et a l . . 1991 . En r , sl , m , 
les cellules de la .oelle osseuse ont ete preleves du femur 
de souris C57DL/6 aqee de 6 n ■> o 
is Fr.n^i r sememes (Iffa -Credo, 

'■ ^ance,. Les cellules en suspensions ont ete lavees et 
resuspendues dans du DMEM enrichi avec 10 S de serum foetal 
de veau, 10 % de milieu L-cell conditionne et 2 mM de 
glutamine, sans ant ibiotiques . 10 6 =ellules Qnt 

ensemencees sur des plaques 2 4 Du ^ Co-tr-ir - r . ' 
, ua it . 0 Lostar a fond Dlat 

dans 1 ml. Apres quaere -ouri a ri»r 

, ^u..., a w Udns une atmosDhere 

«WU«M«ir„. Les c.i Wts d.un pu lc= „ ntr61 „ OI ,: ^. 

,yw * avec du trir °" * »o 4 o.i •, i...:, „ !c ; 

noyaux enumcrcs F^vi> "- c , . „ r 
et_e comptoes. ['our I'lr'^'-v 
diTfo7 enl^j plasr.idor 



-^OOmr. er.tre ,,, , r 0 ,8) el dilue jusqu'a 
10 foir ' dan « «n nun.,,, pour macrophage 



une DO de 0,1 puis 

1 ml a etV- ajoute a chaque p»itr, c 



J-es p^aqi 

avaqer; , lor. . ^ i ■ 



atre heme;; a V7"c. Apres t. ro j. 
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lyse (Promega) . 100 ,1 ont ete sondes et la lumiere ermse 
a ete .nesuree sur 25 . Si-nultanemenu. les bacteries ont 
ete enumerees par etale.nent sur L-agar-kanamycine (20 
1). La lumiere emise est exprimee en ULR/l 0 3 
$ bact£ries. 



20 



Analyses des banqucs de donnecs 

Les sequences nucleot i di ques ont etc comparees a 

<« HMBL et Gennank en utilisant ' 'ai ger i th~,e i-'ASTA et les 

sequences proteiques ont et.- anlvw. • • , • 

- d, ' ai y^ccs par similitude 

grace aux banques de donnees PIR Swiss Prot en utilisant 

1 1 al gorithme BLAST . 

15 Example 1 : Les vecteurs pJVKD 

Les vecteurs pj VED (ngure 51, sent des plas.ides 
portant un gene phoA tronq^ d, ,. coi ; depourvu de codon 

d' initiation, de sequence ^ 

1 • lcl - ' ae sequence 

regulatrice. Le site multipl, clonane (SMC) n~r,et 

1' insertion de fragments d,s genes codants * oour 

d'eventuelles proteines export*'—; , - r - • - 

t ^ - ■■ ■ i-r.-j- q..e leurs sequences 

" e r ' gUlation - Dds lo -' ^ prc-^r.e de i us ion peut et- 
produite et presenter une activity phosphatase alcaline m 

etrc product, ives. Ainsi, > <\\«r ^ „,,^; f .^ , 

11,J u;lil: ' phaser. d^ 

lecture. Tir> av.il d^ ■ - 

' ' " " 4 ce -ucifcraae d», 

insert. ^ ^n n n r Jompl , r - avcc le (Vjdon 

initiation mais sanr, qw ■ auc:;n ::r— oteur 



oovrait a -in si. s'expn^r jy. 
:r/nthet ; que . t; ;: nouveue o; r>-< 



^ ete utiili 
^a:u, ; Jr: cr ^ T 
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coil -mycobacteria,., avec un gene He resistance a la 
kanamycine comma marqueur de selecnon. 

phoA et luc fonctionnent conune dans un opSron, mais 
1 'exportation est nScessaire pour 1' activity phoA. 

Quatre piasmides ont ete construk, par insertion 
dans ie SMC de fragments d ' ADN d'origi„ e diverse : 

Dans la premiere construction nommee pJVED/W aF, l e 
fragment de 1 , 4 kb provient du plasmide ri.-i* . 

et al., 1995) . ce fragment iasu du g , ne p. lacCa _ e 
(blaF, de M. fcrtuitun, D21G ri'imm et al., 1994 , lnclut ]p 
promoteur mute hyperactif, ie segment codant pour 32 acides 
a-nes de la sequence signal et les 5 premiers acides 
amin " 5 13 P-^ ine — Ainsi cette construction 

xnclut le promoteur le plus fort connu chez mycobacteria™ 

et les elements necessaires a i'cy^Mrinn ri« i 

" expo. tat ion de la proteine 
do la fusion phoA . Par consfquent , Q , pcut ^ 

cette construction une forte emission de lumier* „ t are 
bonne activite phcA (cf figure:; 51 et 54 , . 

Dans une dcuxieme construction no»3, pJVED// 1SD j a 
u., fragment de i,, kb a et * clone a part , r du P l asmidc d<jA 
o6cnt PPM1745 (Servant et al., 1995) . Ce fragment ir ^ ut 

nUCUOtidCS COi * nt * ^ 1- ciix p irai on: acides anun^ 

ce la nrntt'Lii^ do -h^.- ♦ 

~" ^ " ^ --d^'-' ae 18 Kb : 5:5,1;- de 



^^"re'pto/riyces alhut; (heaf s;;o 
-e liaison do ribosome, 
sites reguldteurs control ant 
appartient a la familU? d> 
faible poidn :;:ol ecu ] a 1 



'.on 



son -xpre^sion. Cette proteine 
alpha crystalline de KSP a 
Verbon • a 1 19 9? ! a — 



i e ■; a 
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Twpn/ DanS ^oisieme construction, ncunee 

PJVED/Pi^, !■ mserf. i ssu de p.xp.io (L Jm et al 199SJ a 
coupe et clone dans le SMC de pJ v E c a . C c fragme nt 
mcluc les nucleotides codants pour l es 134 prefers acideo 
amines de la proteine connue de M . Cu bGrculoais 39 kDa ec 

de ses sequences regulatr.ces . conune cela a pu etre mis en 
evidence, cette proteine P c f i • 

, n . 6 SSt une ^Poproteine glycosylee 

(Garbe et al ioqi . u ~ 

' " 3 ■ Herrraann et al-. 1996). sur les 
fl9UreS 53 ct ^ observe, pour cerr. ,™ ■ n 

oonne activite 2ltc corresDonHmr a 

currespondam a un promoteur fort nais 

I'acrtivite P »oA est la plus forte des quatre constructions 
L'activ.te P HoA elevee de cette protege de fusxon avec une 
ixooprote.ne s'expUque par le f ait quelle reste attachee 
a la paro: cellulaire par son extreme N-terminal 

oJVFD/ Da T Ja qUatr ^ me Ct de --'- construction nonu.ee 
pJVED/erp 1 xnsert provient de p Ex p 5 3 ( Llm et al . 1995} e . 

a ^ clone dans le SMC de pJ VED a . pRxp53 est le P la Smld . 

lnUlal " 1CCtl °^ POUr active p/koA et contenant une 

partic du gene erp de M. tuWc-i ' - 

'■^..n.j.os.s qui coae poux un 

antxgene de 28 kDa. Co dernier inclut la 8 <W„c» s^al 

une partxc de la proteine rr.ature or, en a~or^ du " -od ' 

d- initiation, le site de lia 1S on de ribosome . pro.oteur 

a ete cartographies. Uiw bor p f 0 >- 
type fi;r est present* dans 



a 1 ■ ' 19 9 5). L'ornm-: 



en 

c:eLt:e region et ^ M( , adro ]a 

prevu (tigures ^ 5,;' r -,, 

„ . " - t : uct ion pre sent e uri'* 

>»n„, e ,„ 1S31 o, lllali „ eu , e „ u „ e bonn , ; a = t . vj; . ^ ^ 

fait, que cette proteine de fusion, 



rucion avn; 



contra i rement A la 



^ lipoprotein.:- ci- ; _< ^ [; - 

^ k ^ - a ia iaroi -oi ' ^ , ; . , ... . * ^ ' " ^-•■ :) — P^ 

" w exc.ut r;as ' ^ = . . 

r. i " i ...... . 
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M. tuberculous dans les vecteurs P JVED S et ld ent i 1 icat ion 
d'un des membres de ces banques, (DP428), induit au cours 
de la phagocytose par les macrophages murins derives de la 
moelle osseuse. 

Les differences constructions sont testees pour 
leur capacite a evaluer !• expression intracellular des 
genes identifies par 1' expression de . pho A. Dans cet 
objectif, 1'activite lac est oxpn.ee en URL pour i 0 3 
bacteries en culture axemque et/ou dans den 
intracellulars. ^induction ou la repression suivant la 
phagocytose par les macrophages murins derives de la moelle 
osseuse peut etre cvaluee convenable.nent par la mesure des 
activites specifiques. Les resultats de deux experiences 
distinctes sont presentes dans ] e tableau 2. 

Le plasmide pJVED/hsplfl a ete utilise co™ C 
controle positif pour 1' induction durant la phase" de 
croissance intracellulaire . Bien que 1 ■ induction du 
promoteur par 1 G chauffage de la bacterie a 42°C n'ait pas 
ete concluant la phagocytose de la bacterie conduit 
claimant a une augmentation de I'actwUe du promoteur 
Dan. toutes les experiences, •■activite Juc intracellulaire 
a 6te tortcment induce, augnentant: do 20 a 100 fois 
I'activite basale initialcmcnt faibl- (Servant, 1995). 

Le plasmide pJVEn/M a '■' , ot-.--, i 

1 w '' /; - irJ ' " utilise conune controle 

ae ^ i modular, ion no:; soeci f ic;-.'^ n >•<- a • . 

— - !r ' -a phaqccytose. 

Le f'rnbleK variation': •■ ■ 

anises en evidence, 

prooarjlerrenv riu^s : i 

' '"■- n '- :i '- a u " conditions d- 
cultures. Quoi qu'il en sou, ces faibler, variations „.. 
S ° ia P3S com Pa™bles a -induction observe, avec ]~ 
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TABLEAU 1 



Construction 


% Recuperation 


pJVED/A/a/^ 


0,5 


pJVED///.y;AV 


0,6 




0,7 






Construction 


% Recuperation 



URI7I0-' 
bacterics 



URIV10 1 
bacterics 



cxjracdl^nrc intracellulairc 
i460 1727 ~ 



Induction 



J 
0,06 



\j^E_D/bIar 



C57HL/6 Halb/C 



urivio 1 

bacterics 



6,7 
1,6 



1.7 



2.1 



_57_ 
18 



i URL/10* 
I bacterics 



— L 2 _ 
_7,!_ 

300 ~ 



cxtraceilulairc | intracellulairc 

- . _ l«7BI76JBajb^C 

_I__L?L_ 3,3 ||5.6 



662 
1 64 
008 



Induction 
C57BL/6 Ualb/C 
1.4 



TABLEAU 2 



Construction 



Is 



VED/bhr 



pJVF.D/Dt>J28 



% Recuperation ! URL/K) 1 
i bacterics 



22 



21 



.1 



! URL/10 1 
: bacterics 
cxtraceilulairc 1 i ntracel iulair c 

0,2() 



Induction 



! 0.25 



Le fragment: n\: e : d: que 

terminals c j M polypeptide ;:ri2--> 
-C;nte;i-; dans ] o piasnid* 
18 1;: . 



:1'.![)0: 

r,a totalise dc ia seqi 



1 6.8 


26" 


; 4 


dTs 


~da:it_ pos> la 


req } o: 


.''•'".iLif.'r. -e SH'J ;p 









DP4?8 , y IUen<; " CC£,ant ^ 1« Polypeptide 

Jt l2tl 11 Gte obtenue comtrve dotal] lee 

'j T n-« sonde a <^r -' ; — ■■♦ 

' a i de 

-1 eoL ides d" .,»•'* ; • : ( , > • , > — 



c : - a ; r m s . 



WO 99/09186 



PCT/FR98/01813 



15 



sonde Les results de 1 .hybridation ont fait apparaitre 
qu un fragment d ' ADN d'environ 1,7 kb etaxt marque. Du fait 
qu'il existe un site Seal attendant du nucleotide nt 98< 
au nucleotide nt 989 de la sequence SEQ id N o x c , egt , 
dire du cote 5 - de la sequence utilisee co« sonde, la fl n 
de la sequence codante est necessaircment presente dans 1~ 
fragment detecte par hybridation. 

L ' ADN genomique de la souche M,: 103 de M 
tuberculosis, apres digestion par Seal, a subl UPe 
migration urs gcl d , dgarose . r _ ^ 

uprises entre l, 6 et 1<8 kb ^ ^ 
veeteur P SL 110 o (Pharmacia, pr6al ablement cllv6 par Sca , 
dephosphoryle. Apres transforation de coli avec les 

veeteurs recombinants resultants, les colonies oh. 

eoionies obtenues ont 
ete cnblees a i. aide de la s cnblaae , 

, . '-ij-uiage a perm is 

a isoler six colonies hybridant avec cette sonde 

Les inserts contenus dans l ou plasmides des clones 
recombinants precedemment selectionn6s ont et, sequences 
Puis les sequences alignees de nanie.o a determiner U 

21 t r 1 " e ^ 13 °<« Ucn « ^ant pc,, DM28 , plu 
specif iquement la SRQ :d n* 2, ' 

Un couple d 1 amorces a W. s^—hr^.o- 

"^^ nuis ^ a ^n d • arnplif ior 
a partir de 1 ' ADN qono^iaun r *n m ^ u 

y Ge w - tuberculosis, souch* m,- 

103, la totality do la sequence codarr. p., n , . 

^ DP42B. L'ampliccn obtenu , 6^ ' d-,^ 

d expression . 

couples d • a — v-< , 

- u..,^^., 'pi upr ies pour 1 1 and ;r 'ca ,; -- 

l,'" Cl ° nayC / h ' '" ' -dant P o:u ; e poiypeotido 

---i.io<_o pai 1 nomme c:;i metier 
30 sur la base des sequ~n-~s -^^ H r „ 

1D N0O 1 ^ot . cliques S HQ ID N" i et gf-C 
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" Am ° rC ; all6r (SE ° 10 N " -pzcnant la S e quence 

allant du nucleotide en position nt 1021 au nucleotide nt 
1044 de la sequence SEQ ID N° 2 : 

- Amorce retour (SEQ ID N° 30), covenant la sequence 
co m pl6 m entaire de la sequence allant du nucleoside " e, 
position nt 1345 au nucleotide en position nt 1325 de la 

sequence SEQ ID N° 2 : 

5' ~CAGCCAGATCT GCGGnCGCCrrr.CACCGC:C. T(^ 3. 

dans lesquelles la partl e soulignee reoresente les 
sequences hybridant speci f ique.cnt avec la s.auencc SEQ ID 
2 et les extremites 5' correspondent a des sites de 
restriction en vue du clonage de 1-amplicon resultant dans 
un vecteur de clonage et/ou d • expression . 

Un vecteur particulier utilise pour 1 'expression du 
polypeptide DP428 est le vecteur p0 R70 commercialism par la 
societe Qiagen. 



EX6mple 3 : La ^quencc complete du gene DP428 et ce ses 
regions flanqu antes . 

to sonde de la region codante de DP428 a ^ 

- ° btsnM ACP, et. utilisee pour b-V . .«,,„ - 

ae aifterentes esaeces d<- , • - .... ... . ,, . .,, 

- » at.'.:: .cg. I. apres los 

rf.su i tat « de la figuie 3, le qcik- e r,r :>;esor.t .-^ 
dan, les u;y,obacteries du cc.nWe de M . \uberculZ 

. -'^alyse de ia sequence suggere que DP428 pourrait 
-lire partie d'un operon t ,.,-..„.„„ 

regions flanquanten no or^n,. r> 

- 1 <--n- :;r>:^;:. ; x; :.e aver- dci 

sequencer connuen <)r> V r^6„ r * - 



us. 



WO 99/09186 



PCT/FR98/01813 



87 



10 



argxnxnes pourraient corresponds a un sxgnal de rctentxon 
et la proline DP428 pourrait etre accrochce par ce motif a 
des peptidoglycanes comme cela a deja ete decrit chez 
d'autrea bacteries Gram" (Navarre et al . , 1994 et 1996) 

Le mecamsme de survie et de croissance 
intracellular des mycobacterres est com P lexc et les 
relations intxmes entre la bactdne et la cellule here 
restent xnexpl xquees . Quel que soxt l e mecanxsmc. ia 
croissance et la survxe xntracel lulaxre des mycrobacter xes 
depend de facteurs produits pax la bact6rie ^ ^ ^ 

moduler la reponse de 1 ■ note . Ces facteurs peuvont etre de- 
molecules exposees a la surface cellulaxre telle que LAM ou 
des^protexnes assocxees a la surface cellulaxre, ou des 
molecules activement secretees. 

D'un autre cote, mtrace 1 lul a irement , les bacte^e- 
elles-.emes doivent faire face a un envxronnement hostxle 
Elles semblent y repondre par des m0 yens proches de ceux 
mis en oeuvre dans les conditions de stress, par 
1' induction de proteines de choc thernuque (Dellagostin et 

2" al., 1995), mais aussi par mdurt^on i >- - 

-'' u -"-t--o.i ou la repressic.-. d«-> 

dxfferentes protexnes (Lee et al . , 1995). En utilisant uno 
mcthodologi,- derivee de la PGR. Plu,, -,t Clark-curt is, 'P^-, 
et 19941 ° nt ***** ^u'un dc ,;. avium incIu dans 

un fragment d ' ADN de 3 kb p S r inHn- i 
par cie.s macrophages hunams. O y £ rUf code DQ v 



is 



2S 



^xpor.ee co,prenant une sequence leader n^prLenranr 
pas d 1 hnn:)Iuu;o c iqni t 7 1 ca i 



ie:; sequences propose,- 

par les banau-.s d^ d — * - . ^ - 

' iJ " uLcao:i - pendant. Ia chase 

de croissance intrac^l 1 r 1 -m r-o . 

^ci^nuiaire, d une proteine dc choc 



. LIU/: 

lhemiqUe de fnible P*™- -oleculaxro issue do M . leprae a 

a a 1 e:r,en t: e t: e i 

aucrv: ecudc, 



egnlerr.er.t m:,.o cvxdence ; 1 aq c,r I :: ... al 
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induces et 28 reprices. Lcs memes pro teine S sont mises en 
jeu au cours dc stress provoqud par un faible pH . un choc 
thermique, H 2 G 2 . ou au cours de la phagocytose par des 
monocytes humains de la lignee THPi . Quoi qu'il en soit l e 
comportement des proteines induites et reprices etait 
unique dans chaque condition (Le e et al . i995) Pris 

Gn ; emblG ' CSS r6sUlt3tS indi^uenr. qu ■ un dialogue 
moleculaire subtile est mis en P lace entre les bactenes et 

leurs botes cellulaires Dp m h,,i„„ 

Ue CG dia logue depend probablement 
le sort de Torganicmc int.aceilulaire . 

Dans ce contexte, -induction de 1 -expression de 
DP42B pourrait etre d ■ une importance .a;;eure, indiquant un 

role important de cette proton dan- i„ 

i aans la survie et ia 

croissance intracellulaire . 

La methode utilisSe dans cos experiences pour 

evaluer 1 'expression intracellular des genes(cf. Jacobs 

et al., 1993, pour la methode do determination 

1 'expression de la luciferase de luciole, et Lim ct a i 

1995, pour la methode de d6t_: ln atio, de 1 'expression du 

gene PhoA) presence 1'avantaqe d ' >-,, , lnn i fl nnmr> - 

J ---- -i-ipie comparee aux 

autres techniques comme la to~h— - ->.. „ . 

al. (Mahan et al . , 199V' ari -, r -t- /» 

proposee par Banqe et a^ .'p- 1Pn(1 . . , 

y ^- ' l,ar '9- ^ al . , 199G) , ou la 

methode substractive basee s:;: ^ r^u 

- ^ nu oecrr.e pa?- I^lu:^ et 



Clark curtiss (Plum e t: al., iq 9 . ;: 
indiscutablement une variabi 1 - , 

comparaiscii des d^f-^-tr-- ( v,/> . . 

, * J ' " ce ^ mimii que arovocji;p>- 

1' induction ou la reoro^sio- < — ,„ f r > ' 

* ^fiisant, il f , yt 

desomaio possible d, 1 "evaluer fournissant ains. un o„ \ i 

supplemental d- etudes phyoiol.Kjiquen den ; ,-ot^ " 

export eer, identifier, p.u fusion av .y; ohcA . 
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Des macrophages de moelle osseuse de souris sont 
prepares comme decrit par Lang eC Antoine (Lang et al 
1991). Les bacteries de M. segn,entis recombinants, dont on 
a determxnS 1'activite luciferase par 10 3 baccer.es comme 
precedent. sent xncubees a 37 = 0 sous atmosphere 
humxdxfiee et enrichie en C0 2 a 5%, pendant n heures en 
prdsence de ces macrophages de telle manxcre qu'elles 
" lent . P^^es. Apres rxneage pour dlxmxner les 

u^nes rcstantes, on ajoute au milieu 
de culture de 1'amikacine (100 w/ml) pendant deux heures 
Apres un nouveau rincage, l e mxlxeu est remplace par un 
milieu de culture (DMEM enrxchx de 10 % de scrum de veau et 
2 mM de glutamine) sans antibiotxques . A pres Une nuit 
d- incubation comme precedemment , les macrophages sont lyses 
a froid (4-c) a 1'axde d'un tampon de l yse (cee lysis 
buffer, Promega), et 1'actxvxte luciferase par l 0 3 
bactcrxes determine. Le rapport des actxvites a la nuse en 
culture et apres une nuit donn, le coeff:cicnt d- induction. 

Exemple 5 : 

Isolement d ' une qpr-i*-. Ho ^a 

°~ riC do sequences par sequencage 
directement a partir des colonies. 

- c^, ^-.ea.ant. 'expression et 

-'exportation de vhoA onf ^ - is-wW ^ _ lv . f . ■ , n 

Tuberculosis on d<- a: b^v'^ p^- ^>-~- 

" — i-^o. ra:-i crouoe de 

sequences, deux d-entre elles o:,t e, * d'avantaqe etudiees 

■les genes entiers correspondent aux inserts ont. et clones' 

sequences, et des anticornn cent-,. t , : 

' ■ ■ I-- — J-i- >;e ces gene;; 
or.r servx a rnontr^r >t ->,,....„.,; . 

'-• ■'■•---P.e vxectronique que cer; 
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autre gene DP428 a eLe sequence avant que la sequence du 
genome de M. Tuberculosis ne soil disponible. II contient 
une sequence ressemblant a la sequence consensus 
d'attachement au peptxdoglycane, ce qui suggere qu'xl 
s'agit aussi d'un antigene vraisemblablement retrouve a la 
su£ace des bacilles de ]a tuberculosa L'etude des troxs 
genes erp, des, et coin, codant pour DP426 montre que le 
systeme phoA que nous avons d6veloppe che2 l es 
mycobacterxes permet de reperer des genes codanr h„„ 
protexne exportees sans determinant reperable par des 
etudes in sUico. Ceci est part xcul xerement vrai pour les 
polypeptides qui ne possedent pas de sequence sxgnal 
consensus (des) ou non pas de sxmxlarxtc avec des protexnes 
de fonction conmie (erp et DP428) 



Un certain nombre d' inserts ont ete identifies et 
sequences avant la connaxssance du genome de M . 
Tuberculosis, d'autres apre.v Ces sequences peuvent fit re 
consxderees comme des amorces permettant de recherch-r des 
2" genes codant pour des protemes exportees. A ce iour, un~ 
serxe d' amorces ont ete sequeacees et les genes entxers 
correspondants ont ete soxt sequences, SO xt identifies 
d'apres la sequence publiee du genome. Pour tenir cotr.pte 
des erreurs ri^ si'MUfncaoo .„„-„.,,.„ „_ . , 

-" <?a -- Lou J° Jr: ' pnss ::jles, les regions 

en amont ou aval do certainec amorces ont ete 

:or.siderees :c ra n p.uvant faire partxe sequencer codant 

pour des protexr.eo exportees . Dans certains cas ri^ 
Similarity avec des yenes codant pour des prolines 
exportees ou des sequences carnctei i stioues d<, S1 , 7rn . r , 
10 ^''-'xportation ou des curacterist iou^ r.-nl ■• 
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des proteines exports. C'cst le car, de la sequence SEQ ID 

N ° 8G 6t SEQ 10 N ° 8H POSsedanL plus de 77 » de similarity 
avec SEQ ID N° 8A ' . 

Les sequences pouvant coder pour des prolines 
exportees sont les suivantes : SEQ ID N» i, 8 , 9 8G 8H 
13, 3, 10, 19, 20, 6, 16, 22, 23, 24, 39, 44, 4 6, et 50. 

Des genes identifies d'apres les amorces a partir de 
la sequence du genome n'ont aucune caracteristique (d'apres 
la sequence) de proteines exportees. li s . aglt dea 
sequences suivantes : SEQ ID N° 4, 27, n, 12 14 7 15 
17, 18, 21, 31, 32, 33, 34, 35, 36, 3 7,' 38,' 40, ' 41/42', 43,' 
45, 47, 48, et 49. 

D'apres la sequence d'autres organismes comme E. coli, 
on peut rechercher dans l a sequence du genome de M. 
tuberculosis, des genes possedant des similarities avec des 
proteines connues pour etre exportees chez d'autres 
organismes bien que ne possedant pas ae sequence signal 
d'cxportation. Dans ce cas unc fusion avec phoA est un 
protocole avantageux pour determiner si ces sequences de M. 
tuberculosis cedent pour des proteines exportees bien que 
ne presentant pas de sequence signal consensus. II a etc en 

effet possible de clon^- q*--^ - -> r° ,1 - 

v K '» ■-' , une sequence 

similaire a u:; n» n e de E. col' nr. ~ ■> r^... ;in u 

^■ L - ue ,a U::u1j.q htrA . Une 

Cur,:.-):: de SEQ ID N" 4 1- av- r h,-./. 1 ' 

' ' a ..'expression et 

a ^exportation ce pn,A. Des colonics M . smegma tis 
hebergeant une fusion SEQ ID N° 4 3 phoA . ur un pla3mide 

pJVKD sont blcues. 
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Meme si une sequence possede des determinants de 
prolines exporters, cela ne demonr.re pas une exportation 
fonctionnelle. Le sysLeme phoA permet de montrer que le 
gene suspect^ code reellement pour une proteine exportee . 
5 Ainsi, il a 6t6 verifie que la sequence SEQ ID N° 50 
poss<§dait bien des signaux d • exportation . 

TABLEAU 3 



I SEQ ID N" 



Reference dt 
sequence 



An not a t: i or 





par Cole et 




SEQ 


ID 


N°l 


Rv 0203 


_?A. | 


! SEQ 


ID 


N°4 






1 SEQ 


ID 


N°2 7 


Rv 2 05 0 


1 


SEQ 


ID 


N°8 






SEQ 


ID 


N° 9 


Rv 2563 




SEQ 


ID 








8G' , 


H ' 




Pv 0072 




SEQ 


IL' 




Fv 0b'] 6c 




SEQ 


ID 


11° 12 


pas de ored 


f ' t ion 


SEQ 


ID 


N 0 1 3 


- *» 




SEQ 


ID 


N 0 3 


Fv 1 984c 




SEQ 


ID 


N°10 






SEQ 


ID 








SEQ 


ID 


r; 0 7 


pas de pred 


.cti.oi; 


'~seq~ 


r r 




avec decalat 
lecture, pc, 
• : ■• 


je d»> 

i.'tdi: e tre : 


^3E. 


i i ■ 




f ; v 1 303 




SEQ 

t 






Rv f . 1 1 9 9 




S [ -' ; i 




:;° id 







Sequence hydrophobe en 
N -_i e rrr.inal 

Pas de pred l c 1 1 o n 



- 1 ~ ro t< ^ 1 ne m ^mb ranaire 
.Possible proteine ~"~ do 

; transport t ransmerr.brana i re 

I Protein S~D Lac toy! 
| Glutathione -methyl 
_i_gl yoxal ly ase 
i non retrouve dans ~~ 
, JL* . '_J-_^' ^££ c "io^ i x H 3 7 r v 
: probable precurseur 
icutinase avec une sequence 
j * i n nal N-terminale 

if" 1 ?. prediction 

j ' a ' • i:-red : ::t. : <.. n 



nas_de_pred i ct ion 

nr : tei no rv,v;t:i arui l r <> 
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in N° 21 



3EQ ID N°31 



Rv 33 65c 



ruon prc-dite 



M L 



f sen no/threonine proteme 
I k ma.so 

similarity avec uno moUillo 
f pcpL ldnae a zinc 



SEQ ID N°32 

SE Q ID IT 3 3 
SEQ_ID_M U 3<1 
SEQ ID D'^35 
SEP 10 r:°3 6 



Rv 0H22C 



Rv 1014 



SEP ID K°37 



SEO ID N°38 



_n on predite 
i<v__2 l_6 9c_ 
Rv 3 90 9 

Rv 2 75 3c 



Rv 017 5 



SEP ID N n 3 9 ! R v__J 00 6 
Rv 0 54 9c; 



SEp ID N°4£ 



; -Rv 2 97 5c pouvanl 

i_5Ep IU N°11 en phase av-.- ;< v 



_SE0 ID IJ° $2 • Rv 2 02 2 
SEC ' ID V< ° 4 3 j R v 3 2 7' 2 

r ™ " 

i 

SEr id !; 44 ! Rv 0 30-3 



.-IP'. 1 !: . dt o P r ^d_j^c^t ioj^ 

[Existence d'une region 

| consensus avec la tamillc 

' dra c 

I ~" " 

jP'"i-> de n re rl i c t i on 



I F a *l. .' ] " predict ion 

i ^ :<1S . 2 1 2:. _Pi"£^i£t io_n * 

i ~ 

;pas de prediction 

j im: 1 a r i t.e avec des 
I dihydropr icolmate 
! s yn t hases 

i ~~ 

| pa ^ -[',-;'. J_^>_d_ ict i on 
.prediction d e s e q u e n c e 
■n ianni 2 ■ < ^ i goprp to i nc 

, T ! p:*<j_di ct ior. 

: :;■ l I a r : t e avec prate: r 
',.:b-i 1 ; : : 

■= i rr-i i i a r i. to avec uno re* 
' Mans I erase 



p: ^:ku • i : ip op rote, i n*. 
ave: an- seo;aero.e siona; 
N - to : :• i na i e 
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SEQ ID N°5 



SEQ ID N°16 



Kv 3010 



SEQ ID N°22 
SEQ ID N°23 
SEQ ID N°24 



SEQ ID N°50 Rv 0125 



Kv 3763 



MI, 



ProLei ru: do " sur^ui, 

Dertfu:lrt et al . 199b 



(Contient un sit.-.- tic 
j fixation do lipoproteins 
: membra: .aire eucai yote 



! S i te act: i r c^ — 
! pretences 

| Sequence s iqna 1 N-ter::unale 

' f o s :.s i b 1 e 



Legende du tableau 3 ; 

Correspondance des sequences selon L-nvonr.io;: avec l e£ 
sequences predites par Cole et al. 1998, Nature, 393, 537 ^ 



544 . 

* : Prediction que la proteme / par ] a 

soit exportee 
ML : Piedictiion de similarity avec: V. i^rae. 



sequence 



Exemple 6 : 

Ca rac t'jrist 



iques et obtcntion d 



Ti ' ext remi t e *; errr.ina le a- 
detect o- par le symeir- PhvA corrrv.-. 

^"t:vite rhonpiiata^. 

Ln frequence d ' ADN codant pour I 1 >- 
la pioteme ro.C2^ or/, ronr-o^w, . - 



"r.et. t a:r. 



v: t a t 
a , > 



e r i _i n a i e 
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Rv3576 , 
MTCY06G11 . 23 , 
pknM 

Sequence SEQ in N° 29 d.i aene cnmnl.r Mir i 2 5 _ I 7 i4 base.sl ■ 
cf. Figure 29 

Ce gene code pour une proteine de 237 AA, de 25 kDa de 
masse nolaire. Cette proteine est referencee dans les 
banques sous les appellations 
PID:e306716, 
SPTREMBL:P96858 

Sequence SEQ TH N° 30 de ]a nrnr ^ lc M1C2 S t ^ 2 _a £l± ^ 
15 aminesl: cf . Figure 3 0 

M1C2S contient on site de fixation a la partie 
lipidique des 1 ipoproteines de nembrane des procaryotes 
(PS00013 Prokaryotic membrane lipoprotein, lipid attachment 
20 site: 

CTGGTCGGTG CGTGCATGCT CGCAGCCGGA TGC) . 

La fonction de M1C25 n'oot pas certain.- ma is elle 
possede trds probablcment une activite "serme/threonme- 
proteine kinase". Des ressemblancer; sont a noter avec la 
25 moitie C terminale de KOBGMYr-:- nnn^. r>,^,rr 
(MTCY50.1G). nes similarly sont aussi ret rouv*,,, avoc 
KY2 3__MYCT r J . 

Kn -> ' ciu gene codanr — v , . , . 

ccdant poter.Vielle.aent pour une proline legulatrico 
(PID:e3067l5 ( SPTREMBL : P968 57 , Rv3575c, (MTCY06G1 I . 22c) ) 
Le profi] d- hydrophobic^ iKy-e rr ^ : .;. d . a f „ 
est :epiesente a la figure 5 0. 

Un 3ite de r ] i van- -!■> - • . 
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d'hydrophobicite. Dans cettc sequence signal potentielle il 
est a remarque la repetition trois fois de la sequence des 
trois acides amines LAA. 

5 Clonage du gene M1C25 en vue de la production de la 
prot£ine qu'il code: 

Un couple d'amorces a et6 synthetise afin d' amplifier , 

a partir de 1'ADN genomique de M . tuberculosis, souche 

in H37Rv, la totalite de la sequence codant pour le 

polypeptide M1C25. L'ampHco:, obtenu a etc clone dans up. 
vecteur d 1 expression . 

Des couples d'amorces appropnes pour 1 ' ampl i f icat ion 
15 et le clonage de la sequence codanL pour M1.C25 ont ete 
synthetises : 

■is • 

-amorce aller : 

5 l -ATAATACCA TGGGCAAGCAGCTAG':: c:nrqC- 3' 
-amorce re tour : 

20 5 ' -ATTTATAGATCTCTGCTTAGCA^^n^^rrn.^- 31 

La partie sculignee represente les sequences hybridant 
specif iquernent avec la sequence MlC2r et les .-xLremit.es 5' 
correspondent a des sites de restriction en vue du clonage 
25 de I'amplicon resultant dans un vecteur d^ r ' onat((J (lt /()M 
d ' express ion . 

Un vecteur part, i culier: utilise oour ; ^.v ;i >-p SV , r 

polypeptide M1C2^ est In v ^"^i'>- r-^-r- - ^ . 

• - -^--^v^ ' **-' * ' J ~" ^ -i- 1 s e par la 

sccidt -^ Giagen, en suivant le protocole et U, s 

30 recommendations proposes par cette marque. 

Los cellules utilises ; JOUr in clo::a:j! , :;or/ 

barter : es • r rr ^ - . yT , ; , - . . . 

- - :3i u- 1 r-s : st ante .\ ] 1 

t e t : u c v c 1 1 n e 1 . 
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La production de la protemc MC25 est i 1 I us tree par les 
figures 5 7 A e t B . ( Ext rails bacteriens do la souchc E. 
coli M15 contenant le plasmide pM!C25. Les cultures 
bact£nenncs et les extraits sont prepares selon Sambrook 
et al. (1989). L'analyse des extraits bacrSriens est 
effectu£e selon les instructions de Quiagen (1997). 
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10 



20 



1. Vecteur recombinant de criblage, de clonage et/ou 
^expression, caractense en ce qu ■ il so replique chez des 
mycobacteries et en ce qu'il contient : 

1) un replicon fonctionnel chez les mycobact6ries ; 

2) u:i narqusur de selection ; 

3) une casaelte rapporteur comprenam: : 

a) un site de clonage multiple ( pol y ] i nker ) , 

b) eventuellement un terminateur de transcription actif 
chez les mycobacteries, en amont du polyl inker, 

O une sequence nucleot idique codante issue d - un gene 
codant pour un marqueur d ' express ; on , d - export a t ion et/ou 
de secretion de proteme, ladi' 
etant depourvue de son codon 
sequences de regulation, et 

d) une sequence nucleot idique 
codant pour un marqueur d'acr.iv: 
dans le meme fragment, ladite sec 
pourvue de son codon d' initiation 



e sequence r.ucleot idique 
d ' m i ciat ion et de ses 

e o a a n t e ; s s u e d ' u n q e n e 
- d " P-o-oteurs contenus 
: ' :;c ^°' idique etant 



2 . Ve c t e u r re comb man t s e ] c : . 
caractense en ce que la seque:;-.- 
issue d'un gene codant pour u:: 
25 d* exportation et/ou de srV-r/.. .... 



* 1 i e vena i cat ion : , 
nucieot ; diqijp codante 
"■ : 1 r ' ■ ' n -■ d ' e xn re s si or: 
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4. Vecteur recombinant selon des revendications 1 a 
3, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
codante issue du gene luc de la luciferase de luciole. 

5. Veeteur recombinant selon 1 ■ une des revendications 1 a 
4, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d" activity de 
promoteurs continue dan,, ie meme fragment est une sequence 
codante issue du gene GFP de la Green Fluorescent Protein. 



Vecteur recombinant selon Pun. des revendications 1 



a 



5, caracterise en ce que le terminator de transcription 
actif che-, les mycobacteries est le terminates du 

coliphage T4 (tT4). 



6 



7. Vecteur recombinant selon 1 ■ une des revendications l a 
caracterise en ce qu • 1 1 est un plasnude choisi parnu les 
plasmides suivants deposes a la -;cr< (Collection National- 
de Cultures de M i c luorqanisraes , Par;:;, France) • 

a) pJVEDa depose a la CNC" sou-j 1. 
le 12/12/1996, 

b) pJVFDb depose a la CNCtf sous lo ^-i^or 
19 9 7, 

c; pJVEOc depose a la Ci\*C.\' ^ : 

1 O / '"I / - q (T 



N J 1-17 9 7 , 



i -17 9: 



■ eur recombinant selon \ 1 un 
n ce qu 
c 1 onaq- j du do 1 v i ; n w> >- 



7, caracterise en ce uu'il cu— 



" doc; revendications 1 
nu en 1 ' nu des sites 
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favonser 1 1 exportation et/ou la secretion dudit 
polypeptide, ou tout ou partic de gene codant pour ledit 
polypeptide . 

9. Vecteur recombinant selon 1'une des revendications 1 a 
8, caracterise en ce que la sequence d'acide nucleique de 
mycobacterie qu'il contient est obtenue par fragmentation 
physique ou par digestion enzymatique de 1 ' ADN genomique ou 
de 1 1 ADN complementaire d'un ARN d'une mycobacterie. 



a 



10. Vecteur recombinant selon 1 ' une des revendications 1 
9, caracterise en ce que ladite mycobacterie est M. 
tuberculosi s . 



15 11. Vecteur recombinant selon 1 ' une des revendications l a 
9, caracterise en ce que ladite mycobacterie est choisie 
parmi M. africanum, M. bovis, M. avium ou M. leprae. 

12. Vecteur recombinant scion la revendicat ion 10, 
20 caracterise en ce qu'il est un plasmide choisi parrru .lei 

plasmides suivants deposes a la CNCM : 

a) P 6D7 depose 1c 23 janvier 1997 a la CNCK sous ie N oi. 
1814 , 

b) p5A3 depose le 28 janvier 1 997 a la CNCK sous 1- voj. 
25 I H IS, 

c) p5F6 depose le 29 -Janvier 19 r >7 A : fl C NCX sour; 1 \-o T .. 
10 16, 

d) P 2A29 ^po y r. le 29 Javier 1 9 97 a la CNCM sous le N 0 1 
1817, 

*<> e) pDP420 depose j t . 29 janvier 1997 a la CN-X sous le N° ; 
18 IB, 

1 - P-^ ;r - deposu :e 29 j^iivicr 1997 ,1 1; v - - 

1 0 i r. 
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i) plD7 depose lc 31 janvier 1 997 a la CNCM sous le N°I- 
1843 , 

j)pJVED/M. tuberculosis depose le 25 juillet 1997 a la 

CNCM sous le N° 1-1907, 
k) P M1C25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 

13. Vecteur recombinant. selon la revendicat ion 12, 
caract<Srise en ce qu'il s'agit du plasmide P DP428 depose le 
28 janvier 1997 a la CNCM sous le N°l-i818. 

14. Precede de criblage de sequences de nucleotides issues 
de mycobacteria pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 
pouvant etre induits ou reprimes lors de 1' infection, leurs 
sequences promotrices et/ou regulatrices associees 
susceptibles notamment de permettre ou de favoriser 
1 'exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterise en ce qu'il met en oeuvre 
un vecteur selon 1 1 une des rever.d i cat 10ns 1 a 13. 

15. Precede de criblage so lor. la revendication 14, 
caracterise en ce qu'il comprend les etapes suivantes : 

a) la fragmentation physique des sequences d ■ ADN do 
nycobactenes ou ieur digestion par au , al „ s un- , !lzv „! 
determine* et la recuperation des fragments obtenus ; 

b) 1 • insertion des fragments obtenur; a ]<otapr. rV . d 

site de clonage, compatible le can echeant uvo.- "'onzy-o u ,-> 

I'et.ape a), du polvlmker d 1 un v-v o->- c-Mn^ '. 

u --- i -^e^. seior. 1 1 une nes 

revendicat 10ns 1 a 13 • 



c) si besom, !• amplification desi:',,; f ra-jrr.ont s 



'-■onteni:: 
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c) la culture dc cellules hotes U u:,s formees dans un milieu 
permettant la noise en evidence du marqucur d ■ exportat ion 
et/ou de secretion, et /ou du marqueur d' activity de 
promoteurs contenu dans le vecteur : 

f) la detection des cellules hotes positives (colonies 
positives) pour 1 'expression du marqueur d • exportat ion 
et/ou de secretion, et /ou du marqueur d • activity de 
promoteurs ; 

g) l'isolement de 1 ' ADN des colonies positives et 
1 'insertion de cet ahm dans ur.c c.liule identique a celle 
de 1 ' etape c) ; 

h) la selection des insertions continues dans le vecteur 
permettant 1'obtention de clones positifs pour le marqueur 
d'exportation et/ou de secretion, „ /nM pour le marqueur 

d'activite de promoteurs ; 

i) l'isolement et la caracterisat ion des fragments d ' ADN de 
mycobactSries contenues dans ces mserats, et 1 'etape i) du 
procede pouvant comporter en outre 
des insertions selec t ionnees . 



etape de s£quencage 



25 



lb. Banque d 1 ADN g£nomique ou d' 
de mycobacteria caractcristV er. 
un procede selon la revendicat 
comprenant les etapes a) et b) , c 
selon la re vend i ca t i on 15. 



enentaire d ' ARNm 
est; cbr.eirjM par 
■ /ou un procede 
f — - c) du procede 



17. B:mque d 1 ADN genomi <.;ue cu 
ue my -obacterie selon la rever- 
se que laditc mycobacteria est 

1^. Banque d ' ADN genomique uu 
de nycobacrori" selon la rev-: 
r - r - q^e \ ri: ♦ rr.vc^b i -e o > ■ .-, .... 



- "I • "'■ u re j ; AKN 

' ■ -i ; ac t c i i see e 
; b a c v. e i i e p a L h o q e n e . 

' : a ; r< * d 1 ARN 

■ ' . ■ 1 1 a t e r i s e ■ j e 
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19. Banque d ' ADN genonuque ou d'ADNc completnentai re d ' ARNm 
de mycobacterie scion la revendication 18, caracterisee en 
ce que ladite mycobacterie est Mycobacterium tuberculosis. 

5 20. Sequence nucleotidique de mycobacterie ou comprenant 
une sequence nucleotidique de mycobacterie susceptible 
d'etre sclectionnee par un procddtf scion 1'une des 
revendications 14 et 15. 



luenv.c nucleotidique de mycobacterie ou comprenant 
une sequence nucleotidique do mycobacterie selon la 
revendication 20, caracterisee en ce que ladite 
mycobacterie est choisie parmi M. tuberculosis, M. bovis, 
M. africanum, M. avium, M . leprae, M . para t ubercul os i s , K. 
kansassi ou M. xenopi. 



15 



22. Sequence nucleotidique scion -une des revendicat: i ons 
20-21 caracterisee en ce quelle esL choisie parrm les 
sequences de fragments d'ADN de mycobacterie de sequence 

20 nucl eique SEQ I D N°l a SEQ 1'J 24C, SEQ ID N"27A a SEO id 
N ° 27C < SE Q ID N°29 et; SEQ ID N ° 3:A a SEQ ID N ° S 0 F . 

23. Sequence nucleotidique oe mycobacterie ) - une d^s 
revendications 20-21 caracterisee en qu'elle est chn iS1 , 

^ par.! les sequences de fraa,,:,, D A ; xycobacr,^:,, de 

sequence SEQ ID N°l s-^ T ^ mo—. f ^.~ ... ». or , f „,„ 

' * ^ ^ - - 5m, Sr/Q ID .\" J 6A, 

SEQ TI.) N°7A, SEQ ;p \;o. 

N°27A ou cv-^, vo- 



10 



veer nurs pDP4 2 8 ( CNCK , N°I-i^: 
p5 E6 ( CNCK , I - l 8 1 6 ) , p2 A2 3 ( Z 

K ° I ■■ 1 8 1 9 ) , t;.i C7 : 7?JCE D<- 



- : - :: ' : '-'^r SE^ ID N n I0A, .SEQ ID 
' — — • : — DP'— -t : v^mei:t. dans les 
p6D7 ( CNCM , N° I - 1 8 1 4 ) , 
b N° I 1017) , p5B5 (CNCM, 
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25. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est complemcntaire de 
5 la sequence d ' un polynucleotide selon 1 1 une des 

revendications 20 a 24, 

b) un polynucleotide dont la sequence comporte au moms 50% 
d'identite avec un polynucleotide selon 1 - une des 
revendications 20 a 24, 

10 r) nn polynucleotide hybridunt dans des conditions de forte 
stringence avec une sequence de polynucleotide selon 1 * une 
des revendications 20 a 24, 

d) un fragment d ' au moins fl nucleotides consecutifs d 1 un 
polynucleotide defim selon 1'une des revendications 20 a 
15 24 ou defini en a) . 



16 . 



Polypeptide, leurs fragments ou fragments 
biologiquement actifs ou leurs polypeptides hornologues , 
susceptible d'etre code par une sequence nuc 1 cot i d ique de 
20 mycobacteria selon 1 ' une d^s revendications 20 a 2 5, et 
susceptible d'etre exporte et/ou secrete, er/ou mduit ou 
repnme, ou cxpnme de facoi, constitutive 
1 1 infection . 



lors a< 



^ 27 . Mycobacteria > ecoi;;bi nante caracterise 
est transformed par un vecteur r 
revendications 1 a IV 



e:: c>-> qu'eii' 
mr<Lr:a::t senior; 1 1 un-? de: 



28. Polynucleotide dor.t U -sequence est choice parmi Irs 
*> sequences micleof. idiques d- aoquenc?: SF.Q TD 1 /\ SEQ LP 
N 3 2 . 
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b) un polynucleotide dont la sequence nucleique est la 
sequence comprise cntre le nucleotide en position nt 964 et 
le nucleotide en position nt 1234, extremity indues, de 
la sequence SEQ ID N°i, 

O un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide defini en a) ou b) 

d) un polynucleotide dont la s6quence comporte au moan, 501, 
d'identite avec un polynucleotide defini en a), b) ou c) 

e) un polynucleotide hybridant dans des conditions de forte 
strmgcnce avec une sequence de polynucleotide defini en 
a) , b) , c) ou d) , 

f) un fragment d'au moins e nucleotides consecutifs d'un 



polynucleotide defini en 



a > * b) , c) , d) ou e} 



15 



20 



30. Polynucleotide selon 1 1 une de 



28 et 29, 



s revendications 20 a 25, 



caracterise en ce que sa sequence nucleique 
hybride avec 1 ■ A DN de sequence de mycobact eries et 
preferentiellement avec de 1 ■ A DN de 



avec 

mycobact eries appar tenant 
tuberculosis . 



au 



sequences de 
ornplexe de Mycobacterium 



7^ 



30 



31. Polypeptide caracterise en ce qu • i 1 est code par une 
sequence polynucleotide selo, I ' une des revendications 

20 a 25 . 



32. Polypeptide caracterise e:; 
polypeptide choisi parm: : 
a; un polypeptide dont la sequenc- 
comprise dans une sequence d'acider 
les sequences d'acides amines SKO ID 
SEQ IP, v :° 2 7A a SK'J I p :P 2>\ 
50F, 



V : 1 - cnprend • m 

d'acides amines est 
amines choisie parmi 
1 a SP: id ir- 24 2, 
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33. Polypeptide dont la sequence decides amines est 
comprise dans la sequence d'acides amines SEQ ID N°i ou SEQ 
ID N°2, ou polypeptide de sequence d'acides amin6s SEQ ID 

5 N°28. 

34. Polynucleotide caracterise" en ce qu VU code pour un 
polypeptide selon 1 ' un des revend i cat ions 32 et 33. 

10 35. Sequence d-acide nucleique ur.il isable comme amorce 
caracterisee en ce que ladite sequence est choisie parmi 
les .sequences d'acide nucleique do polynucleotide selon 
l'uno des revendications 20 a 25, 20 a 30, et: 34. 

IS 36. Sequence d'acide nucleique selon la revendicat ion 35, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences SEQ ID N°25 et SEQ I N'°26 

37. Sequence d'acide nucl^q^. ,,, io;1 L , une des 
20 vesications 35 er 36 pour Kl detection et/ou 

1 ' ampl i ficut ion do sequences nuc ; s> : -a- ,-, 



38. Sequence d'acide nucleic;:- 
caracterisee en ce que ladite s< 
les sequences d'acide r;aca<' 
rpvendications 20 a 25 , 7>l a 3". 



s.ir:de cormne sonde, 



I on 



:hoisie parmi 



tine des 



caracterisee en ce qu'ell 



30 radioacr.if cu par un compose non ra a ; ca a i f 



^eauenc^ d • aside 



i e v e n a i cat ion 38, 
*-> tii:l marque- par un compose 
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41. Sequence d'acide nucleique selori 1 • une de: 
revendications 38 a 4 0 pour la detection 
1 1 amplification de sequences nucleique3. 



et/ou 



10 



15 



42. Sequence d'acide nucleique selon l'une des 
revendications 30 a 41, caractSnsee en ce que ladite 
sequence est une sequence comprise entre le nucldotide en 
position nt 964 et le nucleotide en position nt 1234, 
extremites indues, de la sequence SEQ ID N° 1 . 

43. Vecteur recombinant de clonage, depression et/ou 
d' insertion .caracterise en ce qu ' i I contient une sequence 
d'acide nucleique de polynucleotide scion l'une des 
revendications 20 a 25, 28 a 30, et 3-i 

44. Cellule note, caracterxsee en ce qu'elle est 
transform par un vecteur recombinant selon la 
revendication 43. 



20 



caract6r;sec en 



45. Cellule hote selon la rcvend :. ca \ : o- 
ce qu'il s'agit: de la souche d- " **-->n^ 
plasmide P DP4 2 8 depose le 23 lanv.or 1 VM a la C NCK sous 1« 
N-I-1818 ou transform^ par le plasnud, P M1C25 dtos* le 
4 aout 1998 a la CNCM sous le r.oi-2062, ou d ■ une souche de 

A'. tubcrculocic , ft ; , . - 

- ■ ^ ' -o: C'inu;:: ^osse^ 

potontiicllencnr. tioi;r, < ;V c;:.o-o. ; >- ; 



a r.: eanu;:; 



-;sse:ian: 
rcc ric.'j 



*- . 1 re cede d 
ce qu ' i 1 rr.^ r. 
10 4 V 



: r ei: a : a l i or. 
oeuvre a: 



vccLe:: : 



;epLiae, caracterise en 
la revendication 
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polypeptide susceptible d'mduire une reponso immunitaire 
chez l'homme ou 1 'animal. 

49. Polypeptide hybnde selon la revendication 48, 
5 caracterise en ce que le polypeptide susceptible d' induce 
une reponse immunitaire contient au moins un determinant 
antigcnique capable d'mduire une reponse hurnorale et/ou 
cellulaire. 

10 50. Polvniir^PnfiHo - . , 

. polypeptide hybride selon 

l'une des revendicat ions 48 et 49. 

51. Polypeptide hybnde selon l'une des re vendica t ions 48 
et 49, caracterisee en ce qu'il s . agit d . une prot6 ine 

15 recombinante obtenue par 1' expression d - un polynucleotide 
selon la revendication 50. 

52. Precede pour la detection in vitro d'anticorps dinges 
contre une mycobacteria et pref erer.t lei lemer.t. une bactene 

? ° du COm P lexe Mycobacterium tuU-rculcsis dans un cchantillon 
biologique, caracterise en ce qu • i 1 co.prnnd les eta P es 



"in 



s u i v a n L e s 

a) misc en contact de 1 • echant i 1 Ion biologicue avec un 
polypeptide selon l'une des revend i rat i ons 26. 3 ? n et - 

4 7 ; 

b! ruse en evidence du ccr^'lex'- , r ,-i(„s^. .... < : 

^. L'rocede pou: la detection d ' une motion Dar unc 
n-yconacterie et prof ercnt iel 1 emer, une bacter:e du comnloxn 
Mycobacterium tuberculosis dan., un M : :n; f^,,, caractorin* 

cr ' cu -r-'i: ••.-.'r.proncJ le:; etanen v;in , .... 
preparation d 'un echan' ! 1 i v..-,.*, , ; 
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b) incubation dc 1 ' echant i 1 Ion biologique de l'etape a) avec 
un polypeptide selon 1 ' unc quelconque dcs revendicat ions 
26, 32, 33 et 47 ; 

c) detection d'une reaction cellulaire mdiquant une 
sensibilisation prealable du mammifere audit polypeptide 
notamment la proliferation cellulaire et/ou la synthesc de 
proteines telles que 1 ' interferon gamma ; 

d) detection d'une reaction d ' hypersensibilite retardee ou 
*de sensibilisation du mammifere audit polypeptide. 

54. Kit pour le diagnostic in vitro d'une infection par unc 
mycobactene appartenant au complex* Mycobacterium 
tuberculosis , comprenant : 

a) un polypeptide selon 1 ■ une des revendicat ions 26, 32, 33 
et 47 ; 

b) le cas echeant, les reactifs pour la constitution du 
milieu propice a la reaction lmmunologique ; 

Oles reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunolog ique ; 

d) le cas echeant , un echant 1 linn biologique de reference 
(temom negatif) depourvu d' ant i corps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un echant i lion biologique de reference 
(temom posit if ) contenant un- quant ite predetermine- 

d ' ant i corps reconnus par 1 e d i t ro] vcept 1 de . 



mono- po 1 y c 1 onaux , ieur s ragmen t s, 01: 

ils son:. 

capabies :ie reconnaitre spec: f i qw.Mner.t un polypcpt 



ant;.^orp:; :ini^riques , caractenses en ce ciu 



l'uno des revend i cat 10ns 26, 3.1, 33 ot 4 7 



tide selon 



WO 99/09186 



PCT/FR98/0I813 



tuberculosis dans un echantillon biologique, caractense en 
ce qu'il comprend les etapes suivantec : 

a) mise en contact dc 1 1 Echant 1 1 Ion biologique avcc un 
anticorps selon 1 ' une des revendica t ions 55 et 56 ; 
5 b) mise en evidence du complexe ant igene -ant icorps forme. 

58. Kit pour la detection specif .que de la presence d ' un 
antigene d'unc bact6ne du corr.pl exc Mycobacterium 
tuberculosis dans un echantillon biologique, cararrense en 
ce qu'il comprend les elements suivants ; 

a) un anticorps polyclonal ou monoclonal selon l'une des 
revendications 55 et 56 ; 

b) les reactifs pour la constitution du milieu propicc a la 
reaction immunologique ; 

O les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique. 



10 



15 



59. Precede dc detection et d" identification rapide d'une 
mycobaeterie et pref erent lei le^c a„ , ; . : . llht?rculosis dans 

20 11 n Echantillon biologique, n: ^rtense en cc qu'il 
comporte les etapes suivautes : 

a) isolement de 1 ' ADN a partir : ' Ochan: illon biologiaue 

a analyser, ou obtention d'un AICJc a P art:r de 1 < A r N de 

1 'echantillon biologique ; 
- t: amplification specif iqi>_- 

appartenair ai; comi;lexe ;-.*■. 



i ' AD 



mycobar * *' r i es 



- 'aid" : ' am : o"a selon : 1 u:.^ ; 
O analyse des produits d ' amp 1 i : ; c a 1 1 or; 



6C. Pieced. 



i a 
cter. 
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ayant, le cac ccheant, prealahl ement etc rendu accessible a 
1 1 hybridation, dans des conditions pcrmcttant 1 ' hybridation 
de la sonde a 1 ' ADN d ' une bacterie du complexe 
Mycobacterium tuberculosis ; 

b) detection de l'hybridc forme entre la sonde 
oligonucleotidique et 1 ' ADN' de 1 ' fichant i 1 Ion biologique. 

61. Precede pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosa dans un echanti lion 

biologique, caracterise en cc qu ' i I comprend les etapes 
suivantes : 

a) mise en contact d ■ une sonde ol i gonucleot idique 
immobilisee sur un support seion la revendication 40 avec 
un echanti lion biologique, 1 ■ A! jn de 1 ' echant i ] 1 or. , ayant, 
le cas echeant, etc prealablement rendu accessible a 
1 'hybridation, dans des conditions permet: tant 
1' hybridation de la sonde a 1 ' ADN d ■ une bacterie du 
complexe Mycobacterium tuberculosis ; 

b) mise en contact de 1' hybrid- torme entre la sonde 
oligonucleotidique immobilisee su: un support et 1 1 ADN 
contenu dans 1 • echanti lion biologique, ie cas echeant 
apres elimination de 1 ' ADN d- i ■ evhant 1 1 Ion biologique 
n' ayant pas hybrids avec la sonde, avec une sonde 
oligonucleotidique marquee scion la r-v •::■!;< -a r x 0:i v 

G2 . Pro cede d>> dot-"" • - - 

■■ - ; :a i ca t '. or, 1 1 

caracturise en c:e que, pr^bud.e-;- a 1'er.ane a , :< A^; 
i 'echar.Lillon biologique, ou 1 ' AD No* ubtenu par 
transcription invcroo de 1 'A!?:: de 1 - echant 1 1 1 on , 
amplitie a 1'aidr- d 1 un couple : 
rev^::d i c.- ri t ions ^ \ * • . 



est 
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a) mise en contact de i ' echant 1 1 Ion bioloyique avec un 
couple d' amorces selon 1 1 une des revendications 35 a 37, 
l'ADN contenu dans 1 ' echantillon ayant etc, le cas echeant, 
prealablement rendu accessible a 1 ' hybridation , dans des 
conditions permettant une hybridation des amorces a l'ADN 
d'une bactdrie du complexe Mycobacterium tuberculosis ; 

b) " amplification de l'ADN de la bactene du complexe 
Mycobacterium tuberculosis ; 

-. ^ piiin-ai.iu,i i_itr i i agments a ' aun 

correspondant au fragment encadre par les amorces, par 
exemple par electrophorese sur gel ou au moyen d'une sonde 
oligonucleot i clique marquee selon la revendicat ion 39. 

64. Procede pour la detection de la presence d'une bactene 
appartenant au complexe de Mycobacterium tuberculosis dans 
un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 

a) mise en contact de 1 Echantillon biologique avec deux 
couples d'amorcer. selon 1 • une des revendicat ions 35 a 37, 
20 l'ADN contenu dans 1 ' echant a 1 1 on ayant ete, ie cas 
echeant, prealablement rendu accessible a 1 ' hybridat i on , 
dans des conditions permettant une hybridation des amorces 
a l'ADN d'une bacterio du complexe Mycobacterium 
tuber cu J of; i fj • 



15 



?s h/ amplification do i ' AD:; c 
>lyccDacter_:u;;; f.:-bo r cu 1 os j s ; 
c) rruse on 



laments d ' AD:; 



evidence de 1 ■ arnplif ication do 
correspondant: au fragment: encadr* par lesdile, forces, ,ar 
exemple par o 1 o, :t rophorese sur qol oa au T.over. ! ' une sor.d.' 
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a) une sonde o 1 igonucl eot idi que selon 1 ' une dec 
revendications 38 a 42 ; 

b) les r£actifs necessaircs a la mise en oeuvre d ' une 
r6action d ' hybridat ion ; 

5 c) le cas echeant, un couple d 1 amorces selon 1 ' une des 
revendications 35 a 37 amsi que les reactifs nScessaires 
a une reaction d ' ampl i f ication de 1 1 ADN (ADN genomique, 
plasmidique ou ADNc) d'une bacterie du complexe 
Mycobacteri urn tuberculosis . 

1 n 

66. Kit ou necessaire pour la detection de la presence 
d'une bacterie du complexe Mycobacterium tuberculosis dans 
un echantillon biologique, caractense en ce qu'il comprend 
les elements suivants : 

15 a) une sonde oligonucleotidique , dite sonde de capture, 
selon la revendicat ion 40 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, 
selon l'une des revendications 38 a 42 ; 

c) le cas echeant, un couple d' amorces selon l'une des 
revendications 3S a 37 amsi que les reactifs necessaircs 
a une reaction d ' auipl i f icat ion de 1 ' ADN d'une bacterid du 
complexe Mycobacteri urn tuberculor, : s 

67. Kit pour 1 'amplification de 1 ' ADN d'uno bacterie du 



20 



corr.piexe Mycobacterium t ul 



:u±or>ii: present dans un 

echantillon biologiqu-, caracteri s- en ce cu ' i ; ( -r> 

elements suivants : 
a) un couple d' amorces selon l'une des revindications 3b a 

3 7 ; 

n b; les react: is nec f *ssa i r-,- v .>- , .,<■ f . x r ,,. , , r 

' ' r- — ■ • ^-c: u:ie rear" ]:_■:■ 
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68. Composition immunogene caracterisee en ce qu'elle 
comprend un ou plusieurs polypeptides oclon 1 ' une des 
revendications 26, 32, 33 et 47 et/ou un ou plusieurs 
polypeptides hybrides selon 1 1 une des revendications 40, 49 

5 et 51. 

69. Vaccin caracteris6 en ce qu ' i 1 contient un ou plusieurs 
polypeptides selon l'une des revendications 26, 32, 33 ct 
47 et/ou un ou plusieurs polypeptides hybrides selon l'une 

10 des revendications 48, 49 et 51, en association avec un 
vehicule pharmaceut lquement compatible et, le cas echeant 
un ou plusieurs adjuvants de l'immumte appropries. 



15 



70. Vaccin destine a 1 ' in rum isat ioi: a 1'encontre d 1 une 
infection bacterienne ou virale, telle que la tuberculose 
ou 1' hepatite, comprenant un vecteur selon la revendica t ion 
43 ou un polynucleotide selon la re vend ica t ion 50, en 
association avec un vehicule pharmaceut iquement acceptable. 



20 71. Vaccin caractense en ce qu'i: contient une ou 
plusieurs sequences nucleot id i ques seior; l'une des 
revendications 20 a 24 et/ou un ou plusieurs 
polynucleotides selon la revindication 2b en association 



avec un vehicule pharmaceut iqu 
e c he ant , u n o u p i u s i e u r . ; 
:u:croor i es . 



-ompat.ible et, io cas 
ant 5; de 1 1 : mrnu:i 1 t. e 



;s eatables d 1 1 nhiber 



72. Methode de cribiaqe de mcl-- 
la croissant de mycobac te r 1 e., ou lc mamtien :b 

mycobact er ics dans bote , .-a:,! 



rules blcquent 1;, ay-:bc^' — ;a fonctio: 



ae: 
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73. Methode de cnblagc selon la revindication 72, 
caractensee en ce que les molecules sont des anti- 
messagers ou induisent la synthese d ■ ant i -messagers . 

5 74. Mol6cules capables d'inhiber la croissancc de 

mycobacteries ou le mamtien de mycobacr eries dans un note, 
caractensees en ce que lesdites molecules sont 
syntheses d'apres la structure des polypeptides codes 
par une sequence nucleotidique selor. 1 • une quelconque des 
10 revendications 20 a 24 ou par un polynucleotide selon 
la rovendication 25. 



15 



20 



WO 99/09186 



PCT/FR98/01813 



1/185 



1 G GAT C CC AGGGAAC GT GA C C ATG fVir GTA GGG ATG A^ t~ - - - 4 - ^^-^^^ . 

1 M V V G M T * ~ 



73 TCAGAAGGCATACGTTGGTGGAACAC!GTCGGAAAGCTGGGAGGTGAATCTG ATG GCT GGC GAC CAA GAG CTG 14 4 

M A G D Q E L 7 



11 J 

8 


GAA 

E 


CTG 
L 


CGG 
R 


TTC 
F 


GAC 
D 


GTT 

V 


CCT 
P 


CTT TAC 
L Y 


ACG 
T 


CTT 


CCC 


GAG 


GCA 
A 


TCG 
S 


CGG 
R 


TAC 
Y 


CTG 
L 


GTG 
V 


GTT 
V 


204 

27 


205 
20 


ccc 
p 


CGC 
R 


GCC 
A 


ACC 
T 


CTG 

L 


GCT 
A 


ACG 
T 


TGG GCT 
W A 


GAC 
D 


GGC 
G 


TAC 
Y 


GAG 
K 


CG7 
R 


CGG 
R 


CCG 
P 


CCC 
A 


AAC 
N 


GCA 
A 


CCG 
P 


264 
47 


2 65 
48 


GCG 
A 


GTC 
V 


CAG 

o 


GGT, 
G 


_ AA 


CCG 


ATC 
I 


GCC TTT 
A F 


GAC 
D 


GCC 
A 


TAT 


TCG 


GTC 


GCG 
A 


CAG 
0 


CTT 


TTT 


GGC 
G 


GAC 
D 


32 4 

67 


325 
63 


GTC 
V 


ACT 

T 


GGT 


GCC 
A 


CGC 
R 


GTT 

V 


GCG 


GGC GTC 


CAG 


CCG 






C AG 


^- AC 
ri 


ATA 

I 


CGG 
R 


CCG 
P 


GTC 
V 


CGG 
R 


384 
87 


385 
93 


TTG 

L 


R 


GGG 


CCG 
P 


T 1 G 


GGT 


G 


GTT G ^jG 
v r; 


T <jC 

C 




CGC 






P 


CAG 
Q 


TTC 
F 


GCT 
A 


GGC 


TAT 

V 


107 


* ■> r , 
-i j 

103 




S 


CAG 

Q 


TAG 


CCrCC 


J\cC r 






• TCI 


TGC 








C ■'. ' G ' 


T CGGGGGGCCGC 


TACC 




5 1 5 
4 


5 16 


CCAGCGCC 


GGGGCTCC 


ccgctccgggta 


■■ ■> i GCGCGT 


C GAC 


TTCC 












■-jC 


j AC 


C CGG 


537 


































A 


T 


p 




b 


see 

6 


CGA 

R 


err 

L 


CGA 
R 


AAC 
U 


CGC 


CAC 
H 


CGG 

n 


TTA GAT 
L D 


TCC 
5 


CCG 
P 


T 


GC ' j 






CCA 
P 


GGT 


AAA 
K 


p 




? r i 


6 4 3 
26 


A 


L 


,'\- — j 


p 


GCA 


ACC 


AAC 


CCG TGA 
P 


A GAC 












GGTT 


CC CGC T C AAC CGC AT C 


7 Id 
34 


719 


ATG 


aac 




TGG 




t.;g 


; i ac 




'i' 














7 




CC i 







j GCA AA ; 
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Insert du clone contcnant DP42G et contenu dans seal 
"1 31/11 

GAT CGC CTT TGA CGC CTA TTC GGT CGC GCA GCT TTT TGG CGA CGT CAC TGG TGC CCG CG- 
asp arg leu CPA arg lea phe gly arg ala ala phe trp arg arg his trp cys pro arg 
61/21 91/31 

TGC GGG CGT CCA GCC GCA GCG ACA CCA CAT ACG GCC GGT CCG GTT GCG GGG GCC GTT GGG 
cya gly arg pro ala ala ala thr pro his thr ala gly pro val ala gly ala val gly 
121/41 151/51 

TGG GGT TGG GTG CCT CCG TCA CCC CAG GCA GTT CGC TGG CTA TTT GTC GCA GTA GCG CGA 
trp gly trp val pro pro ser pro gin ala val arg trp leu phe val ala val ala arq 
18]/ 61 211/71 

CGG CAT TGT CGA TGT CTT GGT AGC TAG CAT CCG GTC GGG GGG CCG CTA CCA GCG CCA GC" 
arg his cys arg cys leu gly ser AMB his pro val gly g l y pro ieu pro ala ^ 
241/81 271/91 

CCG GGG CTC CC: GGT CCG GGT ACT GCG CGT CGA GTT GGT CGT GGA CCA GCA ATG A-T GCG 
pro gly leu pr. gly p.n gly 3er ala arg arg val 1 y arg g. y P ro ala met thr ala 
301/101 331/111 

ACC CGG CGA CTT CGA AAC CGC CAC CGG TTA GAT TCC CCG ACT GCG TCA TCG CCA CGT AAA 
thr arg arg leu arg asn arg his arg leu asp ser pro thr ala ser ser pro gly ly 5 
361/121 391/131 * * 

CCG C:G GCA CTA ACG CCA GCA ACC AAC CCG TGA AGA CCA ACC AAC GCC ACC TGr GTA gc~ 
pro pro ala leu thr pro ala thr asn pro OPA arg pro thr asn gly thr cys ala gly 
421/141 451/151 

TGC GGC TCA ACC GCA TCA TGA ACT GCT GGA TTT CGG ACT CCC CGT ACT CT" GCG CAG TG" 
cys gly ser thr ala ser OPA thr ala gly phe arg thr pro dig thr leu ala gin c"s 
461/161 511/171 

GTG CCC GCG AGC CTA CCG AAG ATC GCG TGI ATG CGT TCG GC Cr TGG ACC GCA CAG CAC CTG 
val pro ala ser leu pro lys lie ala cys met arg ser ala trp Lhr ala gin his leu 
541/131 571/191 

GAG TTG GCG GCG CCG AGG GCC GAG ATG GCA GGA TGA CGG AT: GTC GGG GGC GGG AAC TO~ 
glu leu ala ala pro arg ala glu met ala gly OPA arq ile val cily gly gly asn se- 
60L/201 631/211 

CAG GCC CCC .3GA CCG TCG CAA ACC CGT CGC AAA CCC GTC GCA AAC CGT AAG GAG TCA T"<~ 
gln ala ala gly pro ser gin thr arg arg lys pro val ala asn arq Ivs cjl*i 5 , r se^ 
661/221 691/231 
ATG AAG ACA ~GC ACC GCG ACG ACG CGG :GC AGG CTC TTC GCA CCA 



rr.et lys thr n 1 y thr ala thr thr a 



rg a:g any ie\; leu ala val leu lie ala leu al, 

"21/241 75 1/251 

;e - : pro 'I 1 *' ala a:a vai ieu ^ 3la glu pro scr ala thr gly all Tsp prr 

701/261 811/27: 



J i / j ; : 



i * i s-' r a: 



s y o 
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Insert du clone conteaant DP428, autre phase de lecture 
2/1 32/11 



ATC GCC TTT GAC GCC TAT TCG GTC GCG CAG C^T TTT GGC GAC GTC ACT GGT GCC CGC GTT 
62/21 P ^ 9in leU Phe ^ aS P Vai th ^ 9ly ala arg val 

GCG GGC GTC CAG CCG CAG CGA CAC CAC ATA CGG CCG GTC CGG TTG CGG GGG CCG TTG GGT 
ala^gly val gin pro gla arg his his lie arg pro val arg leu arg gly pro leu gly 

GGG GTT GGG TGC CTC CGT CAC CCC AG 3 CAG TTC GCT GGC TAT T'i" J TCG CAG TAG CGC GAC 

IbI/Ti CyS arq hls Pr ° ar? 9ln ^': / ^ d lJ,y lyr leu ser ^ ^ -p 



GGC ATT GTC GAT GTC TTG GTA GCT AG Z ATC CGG TCG GGG GGC CGC TAC CAG CGC CAG CG 
gly lie val asp val leu val ala ser lie ar; ser gly gly arg tyr gin ara .In a 



i . j r» i 

CG; GGC TCC CCG GTC CGG GTA GTC CGC GTC GAG TTG GTC GTG GAC CAG CAA TGA CTG CGA 
ar, gly ser pro val arg val val arg val gl, leu val val asp gin gin OPA Cu 

1U 1 332/111 
CCC GGC GAC TTC GAA ACC GCC AC 7 GGC TAG ATI' :CC :GA CTC GG" 1 ^V- G— ra- r-- 

?LvSl " p ph ' ! < !u '•-= ™ - «" & :;v ^ 

CGC CGG CAC TAA CGC CAG CAA CCA AC J CGT GAA GAC CAA CCA ACG 3CA CCT GCG CAG G"*T 
Vzl/Yil ° CH arg ?la gln pr ° thr ar ^ giu «p gin pro thr ala pr, ala glr. val 

GCC GCT CAA CCG CAT CAT GAA CTG CTG GAT TTC GGA CTC r.r GTA CTC TCG CGC ACT GCG 
482/16? '' iS j^,?^ ?r ° " dl 1CU Ser ar 9 soc ala 

TG~ CCG CGA GCC TAC CGA AGA TCG CGT CCA TGC GTT CGG CGT GGA CCG CAC AGC T GG 
cys pro a.y d ; rt tyr arg arg ser arg ala cv, vai arg a,, aiy pro his ser thi u c 



aGV 7 Go '-GG CCC CCA :;;GG CCG AGA TGC CAG CAT GAC 

ser t r p a r a r q a r r; - iv cro ara t r r a ' - av — , 

rtG -' LZlz r,A '- : - CCC AAA CCG ^tc: CCA aa: CCC 

art; pro d:j a:.p a : a a::; ■ ys pr:i val ala r.n o * o 

o62/22 1 , vv . 

TGA AGA CAG GCA C2G CGA CGA CGC GGC GCA ' 

CPA a::: dn aCi : : r . 1 *~ 'i "i ^ -r ^ > -. . i ... ^ , 



'-j^G GC'j C'oA AC" 

-.j i- J ^ _ a j ^ J, 

' ^ T A A C G A G T C A " * 

"al arg ser y, 
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SeqlC: Insert du clone DP42S, autre phase de lecture 
3/1 33/11 

TCG CCT TTG ACG CCT ATT CGG TCG CGC AGC TTT TTG GCG ACG TCA CTG GTG CCC GCG TTG 

ser pro leu thr pro xle arg ser arg ser phe leu ala thr .or leu val pro ala leu 
bJ/ ^ 1 93/31 

CGG GCG TCC AGC CGC AGC GAC ACC ACA TAC GGC CGG TCC GGT TGC GGG GGC CGT TGG GTG 

arg a a ser ser arg ser asp thr thr tyr gly ar:, ser gly cys gly gly arg tro val 
U3/41 153/51 

leu Til TC<; 3CT ATT TGT CGC ™ ™C GCG ACG 

193/6^ thC PC ° g]y ser ^ H« cys arg ser ser ala thr 

GCA TTG TCG ATG TCT TGG TAG CTA GCA TCC GG'fcGG GGG GCC GCT ACC AGC GCC AGC GCC 

tlt/lT ^ l6U ala Ser 9iV thr ala ser ala" 



GGG GCT Ccc CUG TCC GGG TAG TGC GCG TCG AGT TGG TCG TGG AC" AG" AAT C'~ T-- nr- 

:'■ 3 :• / 1 i ; 



gly ala pro arg ser gly AM 3 cys ala s°r :c • r-n- ,. , ,. 

303/101 ! Ln " scc asn JS ? cys asp 



CCG GCG ACT TCG AAA CCG CCA CCG GTT ACA TTG C(',' ■ - G r- G -r~ ?~ r ( .~ r 

pro ala thr ser lys pro pro pro val arg ph. , :: , cys ^ ^ 0 ™ 7^ 

JO O / lii 3 Q 3 / T -p 

GCC GGC ACT AAC GCC AGC A\C "A CC: GTG AAG A - :. :, r r,r. CAC CTG CG 



ala gly thr asn aid ser asn ql- Dr ^ val 1 vr , - ; ■ " ( ."V, ' ^ ^ K n 

■123/141 * ' _> 9 " 

CGG CTC AAC CGC AT 7. ATG AAC TGC T GG ATT TCg'gAC TCC CCG TAC TCT CGC GCA GTG CGT 

^3/lei " n ^ ^ ^ ilC ^ ^ ' ar, ala val 

GCC CG: GAG CCT ACC GAA GAT CGC GTG CAT 

al=i ar} qiu oro thr glu asp arg va " ~ 
543/101 



1 



>TG GAC CGC ACA GCA CCT GGA 
■ a 1 a a p a i g t hr ala pro g 1 y 



GTT GG3 GGC GCC GAG GGC CGA GAT GGC AGG r.r , , < r . rr ,- rr ,. r _ 



val gly gly ala g l- gly arc; ar.-a 
603/201 

^ ',3 _ j ACC GCC GCA AA-. C C ." 

:;;!/ a: :j arg -hr val a] a a:;: : : • 
663/221 



ir:: gly arg glu 
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Sequence codante DP123 identique a la sequer.ee Rv02C3 p;_elit- pa - Cole , 1 
(Nature 393:537-544) ~ h ^ ^ dl ' 

1/1 31/11 

ATG AAG ACA GGC ACC GCG ACG ACG CGG CGC AGG CTG TTG GCA GTA CTG ATC GCC CTC CCC 

Met lys thr gly thr ala thr thr arg arg arg leu l.u ala val leu ii e ala Zu aL 
61/^1 91/31 

TTG CCG GGG GCC GCC GTT GCG CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG 

leu pro gly ala ala val ala leu leu ala glu pro ser ala thr gly ala ser aso ore 
1*1/41 151/51 ' * 

TGC GCG GCC AGC GAA CTG GCG AGG ACG GTC GGT TCG arc GCC AAG TCG ATG GCC GAC TAG 

cys ala ala ser glu val ala arg thr val gly se r val ala lys ser met gly asp tyr 

JOl/Ol 2 1 1 ; 7 1 ? * r i ■ 

CTG GAT TCA CAC CCA GAR ACC AAC CAG GTG ATG ACC CCC GTC TTG CAG CAG CAG GTA GGC 

leu asp ser rus pro glu thr gin v, 1 met thr ala val leu gin gIn gln val glv 

-' l/81 271/91 

CCC GGC TCG GTC GCA TCG CTG AAC GCC CAT TTC GAC GCC AAT CCC AAG rrrr rr, 

pr, gly ser val ala ser leu lys ala his pho q lu ,1a «„ pro lys val" aTa ^ asp 

J U 1 / 1 U 1 3 3 ■ /' 1 1 1 

CTG CAC GCC CTT TCG CAA CCG CTC ACC GAT CTT TCG ACT CCG TGC TCG CTG CCG ATC AGC 

J' :.^r ' 5 - a l0U Ser ^ leu th ^ J -r ^ ^' -g cy, . „- ; eu pro He 

GGT CTG CAG GCG AT C GGT TTG ATG CAG GCG GTG CAG GGC GCC CGC CGG TAG 
gly leu gin ala lie gly leu met gin ala val ql n L y y-n arg a rq AMB 

SEQ ID N 3 ID 
FIGURE ID 
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-m CCGGTCGGGGGCCCGCTACCAGCGCCAGCGCCGGGGCTCCCCGG7CCGGGTA GTG CGC GTC GAG TTG GTC GTG 561 
1 VRVLLVV7 



554 GAC CAG CAA TGA CTGCGACO 
8 D Q Q 



CGGC ^ACr 



;acttc gaaaccgccaccggttagattcgccgactgcgtca 



•atcg|:c 



rAGGTAA 63 9 



64 0 ACCGCCGGCACTAACGCCAGCAACCAACCC GTG AAG ACC WC CAA CGG CAC CTG CGC AGG TTG CGG 7 0^ 

1 v K T N 0 R H L R R I. R 13 

706 CTC AAC CGC ATC ATG AAC TGC TGG ATT TCG GAC TCC CCG TAG TCT CGC GCA GTG cgt GTC 76S 

13 l n <; : m n c w i z v <j p v s p. a v r a" 



^55 CGC GAG CCT ACC GAA GAT CGC GTG CAT GCG TTC 
33 R E V T F u ? V H A F 



c: o GG 
53 G 



~-c c: 
rc c; r 



cat g: 

D G 



AGG ATG AC 

r< y, t 



GTG GAC CGC ACA GCA CC; GGA GTT 

C K T A P G V 

C IT CGG GIG CGG GAA CTC CCA GGC 

K R G R r :. P G 



62 b 
5 2 



8 35 



S?u CjZ CGG ACC GTC GCA AA.: 
i i R R T 7 A N 



~^7 AC A GC 
3 T G 



ACC GCG ACC 
TAT 



C !3G cr 
R K 



CAA ACC >:r 
v T iv 



:c aaa ccg taa ggagtca-c: 



TTG ■■ 
L 



:27 GGG GCC GGC GTT G: 
2 3 G A A V A 



067 C,CC A,,C G AA GTG GC 
43 A S E V A 



GCG GAA CCA TCA GG .] A '; Z 

A £ ? a t 



AG; AGG GTC GGT TGG GTC g: 
R T V G G V A 



AAG TCG ATG GG; 



ga: 



127 TCA CAC CCA GAG ACC AA.: CA= ; GCG ATG ACC GCG GTC TCG '"AG "A G C" : G~A GGG 
&3 G M P £ T N Cj V M T A V ;. 0 0 Q V* 3" T 



137 TCG GTC GCA TCG CTC AAC GCC CAT 
93 G V A s I. .-• i u 



GAG GCC- AAG 

c a ? ; 



r' 



112 6 

3 2 



12:^ 
1 32 
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TCG CCG GCT CGC GGA CGT 
ser pro ala arg gly arg 
61/21 

TGA CTG CCG GGC TTG ACG 
OPA leu pro gly leu thr 
121/41 

TGA CCT GGG GTG CGT GGG 
OPA pro gly val arg gly 
181/61 

CTC GGT CG^ CGG CAG TGT 
leu qly arq arq qln cvs 
241/81 

TCG TGG TTG CGA CGA CTT 
ser trp leu arg arg leu 

301/101 
GAT C 
as d 



31/11 

AGA TAA TAG CTC ACC GTT GGA 
arg OCH AMB leu thr val gly 
91/31 

CGG ACG ACC ACA GAG TCG GGT 
arg thr thr thr giu ser gly 
151/51 

CGC CGA CGA GTG AGG CAG TCA 
arg arg arg val arg gin ser 
211/71 

CAG CAT GTG CAG ATG ACT CCA 
Qln his val 7 1 n rr e - thr pro 
2 7 1/91 

GGC GCT GGT GAG CGC ACC C G C 
gly ala q 1 y g 1 u arg t h r a - ; 



CGA CCT CGA CAG GGT CCT TTG 
arg pro arg gin gly pro leu 

CAT CGC CTA AGG CTA CCG TTC 
his arg leu arg leu pro phe 

TGT CTC AGG GCC CAC CGC CAC 
cys leu arg ala his arg his 

CGC AG: TTG TTC GTG TTG GTG 
arg z c r leu ^ u e val ieu val 

CGG CGT CGT GCC GCG CAT GCC 
arg a : g arg a i a ala his ala 



SEQ ID N° 3A 
FIGURE 3A 
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PCT/FR98/01813 
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GCC GGC TCG CGG ACG TAG 
ala gly ser arg thr AMB 
63/21 

ACT GCC GGG CTT GAC GCG 
thr ala gly leu asp ala 
123/41 

ACC TGG GGT GCG TGG GCG 
thr trp gly ala trp ala 
183/61 

CGG TCG CCG GCA GTG TCA 
arg ser pro ala val ser 
243/31 

GTG GTT GCG ACG ACT TGG 
Vcii val thr thr trr 



33/11 

ATA ATA GCT CAC CGT TGG ACG 
ile ile ala his arg trp thr 
93/31 

GAC GAC CAC AGA GTC GGG TCA 
asp asp his arg val gly ser 
153/51 

CCG ACG AGT GAG GCA GTC ATG 
pro thr ser glu ala val met 
213/71 

GCA TGT CCA GAT GAC TCC ACG 
ala c y s ala asp asp s c r t. h : 
2 7 3 / y 1 

CGC TGG TGA GCG CAC CCG CCG 
" r G " z ? CPA aid p r - ; , :; o 



ACC TCG ACA GGG TCC TTT GTG 
thr ser thr gly ser phe val 

TCG CCT AAG GCT ACC GTT CTG 
ser pro lys ala thr val leu 

TCT CAG GGC CCA CCG CCA CCT 
ser gin qly pro pr0 pLO prQ 

CAG CTT GTT CGT GTT GGT GTC 
qln leu val arg val gly val 

GCG TCG TGC CGC GCA TGC GGA 
ala ser cys arg ala cys gly 



SEQ ID N° 3C 
FIGURE 3C 
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32/11 

CAA TTT TCC TTC GCG CCG TGC AAT ACC ATC TGC AAG ACC AGC GAC GGC CCG TGG TTG CGG 

gin phe ser phe ala pro cys asn thr rle cys i ys thr ser asp gl y pro trp leu arg 

92/31 J 

TCG CGC AGC TTG CGG AAA CCG GGT ATG GAC CCT GCC GTA CCG TTG TTG CCA CTT GAT GTC 

ser arg ser leu arg lys pro gly met asp pro ala val pro leu leu pro leu asp vaT 

GTC GCT CTC CAC CCG TCG GGG GGC GAA AGC CAT TCC GAC ACT GCG ATC CTC AAP ACG -CG 

TshT Pr ° ser qlV qlY g:u 5er "^/n' 1 ** p chr gly lie leu ly5 ' thr ^ 

S G T v l £ G ^ = ^ ^ ^ ATG TAG GAA CTG AAT AAG 

ala^gl. cy, ,ea gin gly ser gly glu gin pro :1, .le thr met tyr glu leu a,n l ys 

TCC CCC GCG CGC GAC TTC CAG AC A TTT GTT GTg' GTT TCG GTT GAG GCC GAG GCG AGG C-C 
302/101 9lP ' Ph ° ^\;;*} ^ ^ ala glu ala arg leu' 

ATT TCG CAG CAA CCG GTC TCC GGG TCG CAG CAT GGT TGC 



rr - : CAT CGC GGC GCA GTC G~ 

GGA CGA GTC GTC GTC AAC GAC CAC GAT C 
g±y arg val val val a.s: 1 . a.sp his asv 



SEQ ID N° 4R 
FIGURE 4H 



TTT 
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partie de la sequence nucleot idique de seq4A 



1/1 



31/11 



CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA TTT 

pro^rg ala thr ser arg hi. leu leu trp phe^rg leu arg pro arg arg gl y ser P H 

CGC AGC AAC CGG TCT CCG GGT CGC AGO ATC GTT^CG GCG ATC GCG GCG CAG TCG TCG GAC 

tllAV YS ^ r ilG ile ala ala ^ *er ^ asp 

GAG TCG TCG TCA ACG ACC ACG ATC 
glu ser ser ser thr thr thr ile 



SEQ ID N° 4A' 
FIGURE 4A f 



CGC GCG CGA CTT ^.CA 

arg ala arg leu pro 
61/21 

GCA GCA AG C GGT CTC 

a., a ala ser gly leu 
121/41 

ACT CGT CGT CAA CGA 

ser arg arg air: arg 



GAC ATT TGT TGT GGT 

asp ile cys cys gly 

CGG GTC GCA GCA TCG 

arg v a 1 ala a ) a s c r 

CCA CGA TC 
pro arg 



31/11 

TTC GGT TGA GGC CGA 
pho gly 0?A gly arg 




leu arg L : ; g sor ara 



GGC GAG GCT CAT TTC 

gly glu aia hi s pho 

CGC AGT CGT CGG ACG 
arg ser arg arg thr 



SEQ ID N 4B 
FIGURE 4 H ' 
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ORF d'apres par Cole el a!. C'atUH 393:537-^-14) et contenant la sequence Sec 



4A 

1/1 31/11 



tga ata agt ccg ccg cgc gcg act tec aga cat ttg ttg tgg ttt egg ttg agg ccg agg 

OPA lie se: pro pro arg ala thr ser arg his leu leu trp phe arg leu arg pro arg 

61/21 91/31 y 

cga ggc tea ttt cgc age aag egg tct ccg ggt cge age ate gtt gcg gcq ate gcg acq 

arg gly ser phe arg ser lys arg ser pro gly arg ser ile val ala ala He ala ala 

121/41 151/51 

cag teg teg gac gag teg teg tea acg aec aeg ate teg aac teg acg c=c tee tgt teg 

9 thC thr lle Ser asn ser th ^ P« cys ser 

181/61 211/71 

agg atg eta cgc aga cag cgc tcq atg gtg gcg ccg ttg ttg tar; ate ggg atq eac ace 

arg met leu arg arg gin arg ser r.et val ala pro leu leu tyr He gly met his thr 

z 4 1 / o 1 tit /m 



241/81 271/91 
gag ata age ggt ttc gec ggg ttc ace gat acc acg ctt gat qca tea cca nnr 

30V101 SGr Pr ° gl - y ^ ^hr 

tgg cga etc aga gac tag # 

trp arg leu arg asp AM B 

SEQ ID N° 4F 
FIGURE 4F 



sequence e- arr.erit. rie .seq4A' et en fusion avee seq4A' 
1/1 31/11 

GCA ACC TAG CAG CAG AGC CAG GGG CTC ACA GGA CCT AAA GGA GTA GCG CCC A^G C r 'T GAT 

ala thr tyr gin gin scr gin gly leu thr gly pro lys gly va 1 . ,i U pro r,2t ala as:: 

SEQ ID N° 4J 
FIGURE 4,7 



seq4-7 



SEQ ID NMK 



v T \it i\ i .km 
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sequence Rv2050 


predi te 


p d L 


Co .1 


e e t 


a 1 . 


[Nature 


39 J 


; b37 


- S -1 A 


1/1 


















31/11 






ATG GCT 


GAT 


CGT 


GTC 


Lib 


AGG 








CTC GGA 


GCC 


GTG 


AGC 


nfi t 3 1 d 


asp 


a rg 


val 


leu 


a r g 


gly 


s e r 


arg 


leu gly 


ala 


val 


ser 


61/21 


















91/31 






AAC CAC 


GAC 


CTG 


GCG 


CCG 


CLjU 


CAG 


ATC 


GCG 


CGG TAC 


CGC 


ACC 


GAC 


asn his 


asp 


leu 


ala 


pro 


a r g 


gin 


lie 


ala 


arg t_ y r 


arg 


thr 


asp 


121/41 


















151/51 




GAA GTC 


CCG 


TTC 


GCC 


GAT 


GAC 


GCC 


GAG 


ATC 


CCC GGC 


ACC 


TGG 


TTG 


glu val 


pro 


phe 


ala 


dSp 


asp 


ala 


glu 


i 1 e 


pro gly 


thr 


t r p 


leu 


131/61 


















211/71 








GAA GGC 


ACC 


CTG 


ATC 


GAG 


GGC 


GAC 


CTG 


CCC 


GAG CCG 


A AG 


A AG 


GTT 


glu gly 


thr 


leu 


lie 


glu 


gl y 


asp 


leu 


pro 


glu pro 


- j. :j 




va 1 


24 1/81 


















271/91 






CAC TGG 


GAC 


ATG 


CTG 


CTG 


GAG 


CGc; 


CGT 


TCC 


ATC GAA 


GAA 




GAA 


his r. r p 




m e t 


leu 


leu 


























a i" g 






:ie gi'j 


gl u 


1 eu 


glu 


3C1/101 


















3 31/11; 








CGC CTC 


GAG 


CTC 


ATT 


CGG 


TCA 


CGT 


CGG 


ZGC 


GGC TGA 










g I u 




lie 


arg 




a r q 


arg 


arg 


g 1 y ^. • 









leu leu lys glu 



SEQ ID N° 
FIGURE 4M 



ORr' d'apres par Cole et _i 1 N T atur- 393 

1 / 1 ^ ^ 

TAG TCC GCC CGG GTG TCC GAT CCC GGT ATC AC": 

AM 3 ser a: a a r- val :-er i : - rr:) ;<iv i ] :1. 



... v?*J J.- 

irg gl 



lyi gl:: gli: 
13 1/61 



o :\ ant . a 



G C G C " G C G T r G ^ G 



WO 99/09186 
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GAT CGC GGT CAA CGA 
asp arg gly gin arg 
61/21 

TGG CTA CGC CGC GGC 
trp leu arg arg gly 
121/41 

GGA GAT GAC CAG CGC 
gly asp asp gin arg 
181/61 

CAC CGC CGC GG1* GAA 
his arg arg gly glu 
241/81 

GCC CAC GCA GGG CAC 
ala his ala gly his 
301/101 

GCA TCG GTC GCC GAT 
ala .s r r val ala a s d 



GGC CGA ATA CGG CGA 
gly arg lie arg arg 

GAC GGC GAC GGC GAC 
asp gly asp gly asp 

GGG TGG GCT CCT CGA 
gly trp ala pro arg 

CCA GTT GAT GAA CAA 
pro val asp glu gin 

CAC GCC TTC TTC CAA 
his ala ph(> pViM giri 



31/11 

GAT GTG GGC CCA AGA 

asp val gly pro arg 
91/31 

GGC GAC GTT GCT GCC 

gly asp val ala ala 
151/51 

GCA GGC CGC CGC GGT 

ala gly arg arg qly 
211/71 

TGT GCC CCA GGC GCT 

cys ala p:-j gly ri 1 a 
271/91 

GC : GGG TGG CCT GTG 

gly nrp <j val 



CGC CGC CGC GAT GTT 
aig arg arg asp val 

GTT CGA GGA GGC GCC 
val arg gly gly ala 

CGA GGA GGC CTC CGA 
arg gly gly leu arg 

GCA ACA GCT GG C CCA 
ala thr ala gly pro 

GAA GAC GGT CTC GCC 
giu asp gly leu ala 



SEQ ID N° 5A 
FIGURE 5 A 



ATC GCG 
i 1 e ala 
52/21 
GGC TAC 
gly tyr 
122/41 
GAG ATG 
g 1 u me t 
152/61 



AAC GAG GCC GA^ TAC 
as:; glu ala glu tyr 

GCG GCG ACG GCG ACC 



GCG CCT GCC ct: 
ala q 1 v a I v 1 e ; 



r : d . a 



v.. GCC GCC GCG ATG TT 
-p ala ala ala ::.-j f , oh 



; 1 u u 



G.nG GCC 
1 ' : 1 1 ^ 
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TCG CGG TCA ACG 
ser arg ser thr 
63/21 

GCT ACG CCG CGG 
ala thr pro arg 
123/41 

AGA TGA CCA GCG 
arg OPA pro ala 
183/61 

CCG CCG CGG CGA 
pro pro arg arg 
243/81 

CCA CGC AGG GCA 
pro arg arg ala 
303/101 

ATC GGT CGC CGA 
lie gly arg arg 



AGG CCG AAT ACG 
arg pro asn thr 

CGA CGG CGA CGG 
arg arg arg arg 

CGG GTG GGC TCC 
arg vai gly ser 

ACC AGT TGA TGA 
thr ser OPA OPA 

CCA CGC CTT CTT 
pro a r q leu 1 1 * u 

TC 



33/li 
GCG AGA TGT GGG 
ala arg cys gly 

93/31 
CGA CGG CGA CGT 
arg arg arg arg 

153/51 
TCG AGC AGG CCG 
ser ser arg pro 

213/71 
AC A ATG TGC CCC 
thr me*, cys pro 

273/91 
CCA AGC TGG GTG 
n rn ser tiro vai 



CCC AAG ACG CCG 
pro lys thr pro 

TGC TGC CGT TCG 
cys cys arg ser 

CCG CGG TCG AGG 
pro arg ser arg 

AGG CGC TGC AAC 
arg arg cys asn 

GCC TGT GGA AGA 
ala cyj gly arg 



CCG CGA TGT TTG 
pro arg cys leu 

AGG AGG CGC CGG 
arg arg arg arg 

AGG CCT CCG ACA 
arg pro pro thr 

AGC TGG CCC AGC 
ser trp pro ser 

CGG TCT CGC CGC 
arg ser arg arg 



SEQ ID N° 5C 
FIGURE 5C 
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1/1 

TAC GCC 
tyr ala 
61/21 
ATG ACC 
met thr 
121/41 
GCC GCG 
ala ala 
181/61 
ACG CAG 
thr gin 
241/81 
CGG TCG 
arg s e i 



GCG GCG 
ala ala 

AGC GCG 
ser ala 

GCG AAC 
ala asn 

GGC ACC 
gly thr 

CCG ATC 
pro l } e 



ACG 
thr 

GGT 
gly 

CAG 
gin 

ACG 
thr 



GCG 
ala 

GGG 
gly 

TTG 
leu 

CCT 
pro 



ACG GCG ACG 
thr ala thr 

CTC CTC GAG 
leu leu glu 

ATG AAC AAT 
met asn asn 

TCT TCC AAC 
ser ser lys 



31/11 
GCG ACG TTG 
ala thr leu 

91/31 
CAG GCC GCC 
gin ala ala 

151/51 
GTG CCC CAG 
val pro gin 
211/71 
GGT GGC 



CTG 



leu gly gly 



CTG 
1 eu 

GCG 
ala 

GCG 
ala 

CTG 
leu 



CCG TTC 
pro phe 

GTC GAG 
val glu 

CTG CAA 
leu a 1 n 

TGG AAG 
trp lys 



GAG 
gl u 

GAG 
glu 

CAG 
gin 

ACG 
thr 



GAG GCG 
glu ala 

GCC TCC 
ala ser 

CTG GCC 
leu ala 

GTC TCG 
val ser 



CCG GAG 
pro glu 

GAC ACC 
asp thr 

CAG CCC 
g 1 n pro 

CCG CAT 
pro his 



SEQ ID N° SB' 
FIGURE 5B' 



1/1 3i/i: 

ys arg sor arg arg arg a : ; arg 

gg tcg agg a:; 3 cc~ 

qiy :<cr r^cr .ier arg p : •; p r m arg r. ^ r a r c; arv ore 



ACG CCG CGG CGA CGG CGA CGG CGA CGG CGA CGT G *' ~GT A-" — - — ~ ~ r - 

tnr pro arg arg arg a r'j arg ara ara arc air; h,-, 

61/21 " ^ n, : 3:' 

TGA CCA GCG CGG GTG GGG TGG GGG AG G A G G GGG CGG GGG TCG AGG ™ 

OPA pro ala arg va' " 



121/41 

CCG CGG CGA ACC ACT TGA TGA AC A ATG TGG C GC ' AGG GGC TGG AAG AGC TGG CCG AG- re* 

pro arc; arg thr se: OFA OPA : hr ra^- -y S r -. ^„ ' '„ 

13 1/61 r 1 — P a 



WO 99/09186 



PCT/FR98/01813 



16/185 



ORF predite par Cole et al. (Nature 393:537-544) et contenant seq5A* 
1/1 31/11 

tga act gat gat tct gat age gac caa cct ctt ggg gca aaa cac ccc ggc gat cgc ggt 
OPA thr asp asp ser asp ser asp gin pro leu gly ala lys his pro gly asp arg qlv 
61/21 91/ 31 y y r 

caa cga ggc cga ata egg cga gat gtg ggc cca aga cgc cgc cgc gat gtt tgg eta cgc 
gin arg gly arg ile arg arg asp val gly pro arg arg arg arg asp val trp leu arg 
121/41 151/51 

cgc ggc gac ggc gac ggc gac ggc gac gtt get gcc gtt cga gya ggc gcc gga gat gac 
arg gly asp gly asp.glv asp gly asp val ala ala val arg glv g.ly .,1a gly asp aso 
181/61 211/71 

cag cgc ggg tgg get cct cga gca ggc cgc cgc ggt cga gga ggc etc cga cac cgc cgc 
gin arg gly trp ala pro arg ala gly arg arg gly arg gly gly leu arg his arq arq 
241/81 271 / 9 1 

ggc gaa cca gtt gat ydd caa cgt gcc cca ggc get gca aca get ggc cca gcc car gca 
gly glu pro val asp glu gin rys ala pro gly ala ala thr ala gly pro aia hl5 did 
301/101 3 31/Ul 

gg ? cac cac gcc ttc ttc caa get ggg tgg cct gig gaa qac ggt etc gcr gca t-q qtr 
gly his his ala phe phe gin ala gly trp pro val glu as:) gly lea ala ala se- val 
3 61/121 3 91/131 

gcc gat cag caa cat ggt gtc gat ggc caa caa cca cat etc qat gac caa etc ggg tct 

421/141 dSP :jin ft" hls VaJ <1S P ds ? ^ leu gly cys 

gtc gat gac caa cac ctt gag etc gat gtt gaa ggg ctt tgc r r.c ggc ggc ggc cgc cca 

To!/^? 9 MS l6U 9lU iSU aSp val * lu le ' J ~~y* s ^ 91/ gly gly arg oro 

h 8 1 / 1 6 1 511/171 

gcc cgt gca aac cgc ggc gca aaa egg ggt = -<j gg,- gat gag etc get ggg cag etc get 

gly arg ala asn arg gly ala lys arg y. y pro gly ar.p gl,; ,. ;u ala gly gin leu ala 

b 4 i / 1 8 1 t i ■ \ u i 

ggg ttc ttc ggg tct ggg egg tgc ggt qgc :: : ::aa ctt . 

gly phe phe gly :;or gly arg t:r a v ■.; . v arc i-.-u • 

60 1/2 CI ^ ' ' ' r.j; : ; 

ttc gtt gtc ggt gcc gca ggc ctg ggc ~gc qq- . . . .- M >: 

phe val val gly ala ala gly leu gly .; q q 1 y :! ::: • 

66 1 / 2 2 ~~ 5 a ; ^ . 

gcc get qc: get qac cag cct gac caq • : a a i iaj 

gly a 1 a ala ala asp qln pro as: g 1 r. arq a r a 1 -,- 1 V j - 

721/24 1 ' * " - ■ ' ' : ' 



07' gqc etc ggt egg 
gly gly leu gly arc 

cac ccc ggc qg.j q :q 



- - -7 \ q':<-i gar g."t ggg 
a 1 a a r q ai a asp ala q : v 



WO 99/09186 PCT/FR98/01813 

17/185 

sequence Rvll96 predite par Cole et al . (Nature 393:537-544) ct couvant coder pour une 
ORF en fusion avec Seq5A' H 

1/1 31/11 

atg gtg gat etc ggg gcg tta cca ccg gag ate aac tec yeg agg atg tac gec ggc ccg 
Met val a 3 p phe gly ala leu pro pro glu lie asn ser ala arg met tyr ala gly pro 
61/21 91/31 

ggt teg gee teg ctg gtg gee gcg get cag atg tgg gac age gtg gcg age gac ctg ttt 
gly ser ala ser leu val ala ala ala gin met trp asp ser val ala ser asp leu phe 
121/41 151/51 

teg gee gcg teg gcg ttt cag teg gtg gtc tgg ggt ctg acg gtg ggg teg tgg ata ggt 
ser ala ala ser ala P he g] n ser val val trp gly leu the val gly 3 er trp Ue gly 
181/61 211/71 

teg teg gcg ggt ctg rtg gtg gcg c;cg gec teg ccg -at gtg gcg tqg ata age gtc ace 
scr ser ala qly leu met val ala 

ala ala ser pro tyr val ala trp met ser val thr 
241/31 271/91 

gcg ggg cag gec gag ctg acc gec gec cag gtc egg qtt get gcg gcg gec tac qaa arc 
aid giy gin aia giu leu t!u dla ala gin val arg val ala ala ala ala tyr glu thr 
301/101 331/111 

gcg tat ggg ctg acg gtg ccc „cy ccg gtg ate grc gag aac cqt get qaa ctg atg a-t 
ala tyr gly leu thr val pro pro pro val lie ala glu 33n arc ala glu leu rte l 
361/121 3 91/131 

ctg ata gcg acc aac etc ttg ggg eaa aac acc ccg gcg ,te gcg gtc aac gag gec gaa 
leu lie all thr asn iue leu gly gin asn thr pro ala Lie a. a val asn glu ala glu 
421/141 451/151 

tac ggc gar; atg tgg gec caa gac gec gc c gcg atg ttt ;gc tac qcc gcg gcg acg rq 
tyr^gly giu net trp ala gin asp aia ala aia -et pee gly tyr ala ala ala thr =U a 
431/161 511/171 

acg gcg acg gcg acg ttg ctg ccg ttc gag gag gcg ccg gag atg acc age gcg ggt ggg 
thr ala thr ala thr leu leu pro phe glu glu aia nro glu Mt thr ser ala gly v 
541/181 571/191 ' W ^ 

etc etc gag cag gee gee gcg gtc gag gag gec tec gac acc gec gcg gcg aac cag 
leu leu glu gin ala ala ala val glu glu aia act av., t: ir ala aia t ih as- n 1 eu 
601/201 631/211 " ^ 

atg aac aat gtg ccc cag qcc etc caa cag ctg gec Cc 
:-e t asn as n va 1 pro q 1 ala 1 e u gl n gi n leu a la g 1 
£61/221 ' 691/231 

■ctg tgg jag a: 



acc aeg ccr 
th: thr nro 



■jv - '-'--J Jri g d-g g-e t c; : :; -at cc": tc; ate aac aac 



eg atg ;;cc aac aac cae atg teg atg 

en 



va i ser ~e t ala as n a c n his rr\e t ser 



') 1 y 

'32 1 



< Vf ; v ( ■ i f-:i 



WO 99/09186 



PCT/FR98/01813 



18/185 



Seq 5P: ORF d'apres Cole et al . (Nature 393.537-544) et contonanc la sequence Rvll96 
1/1 31/11 

tag gga cac yta atg gtg gat ttc ggg gcg eta cca ccg gag ate aac tec gcg agg atg 
AMB gly his val met val asp phe gly ala leu pro pro glu ile asn ser ala arq met 
61/21 91/31 

tac gec ggc ccg ggt teg gec teg ctg gtg gee gcg get cag atg tgg gac age gtg gcg 
tyr ala gly pro gly ser ala ser leu val ala ala ala gin met trp asp ser val ala 
121/41 151/51 

agt gac ctg ttt teg gec gcg teg gcg ttt cag teg gtg gtc tgg ggt ctg acg gtg ggg 
ser asp leu phe ser ala ala ser ala phe gin ser val val trp gly leu thr val alv 
181/61 211/71 9 y 

teg tgg ata ggt teg teg gcg ggt ctg atg gtg gcg yeg gee teg ccg tat gtg gcg egg 
ser trp ile gly ser ser ala gly leu met val ala ala ala ser pro tyr val ala trp 
241/81 271/91 

atg age gtc acc gcg ggg cag gec gag ctg acc gee gec cag gtc egg gtt get gcg gcg 
met ser val thr ala gly gin ala glu leu thr ala ala qln val am val *i_ a - ■< 
321/101 331/111 " 

gec tac gag acg gcg tat ggg ctg acg gtg ccc ccg ccg gtg ate gc z gag aac cgt get 
ala tyr glu thr ala tyr gly leu thr val pro pro pro val lie all glu asn arq a^ a 
361/121 391/131 

gaa ctg atg att ctg ata gcg acc aac et z ttg ggg caa aac acc ccg yeg ate grg g- c 
glu leu met ile leu lie ala thr as:i leu leu gly gin asn thr pro ala ile val 
421/141 451/151 

aac gag gee gaa tac ggc gag aty tgg gee caa gac gee gzz geg atg ttt ggc -ac 
asn glu ala glu tyr gly glu met trp ala qln asp ala ala ala met ohe gly tyr all 
481/161 511/171 

gcg gcg acg gcg acg gcg acg gcg acg ttg ctg ccg ttc gay gag gcg ccg gag atg ace 
ala ala thr ala thr ala thr ala thr leu leu pro phe glu glu ala pro glu met thr 
541/181 571/191 

age gcg ggt ggg etc etc gag cag gec gec gcg gtc gag gag gec tee gac acc gec grg 
ser ala gly gly leu leu glu gin ala ala ala val glu glu ala ser aso th- ala ala 
601/201 631/211 

gcg aac cag ttg atg aac aat gtg ccc cag geg ctg caa c^q ctg gee eag ccc acg cag 
ala asn gin leu me- asn a sr. val pro gin ala leu gin gin leu ala aln oro thi u 1 r 
661/221 691/231 ' * 

ggc acc aeg cet tct tec aag ctg ggt gge ctg tgg aaq acg qte teg ccg cat egg trq 
3ly thr thr oro ser ser lys leu gly gly leu trp Ivs thr val 3cr ere re, a -q op ~- 
721/241 751/251 ' ------ 

:cg ate age aac atg gtg teg atg gee aac aac cac atg teg atg ace air tee cet g*e 
nro ile ser asn met va . ser rr^t ala asn asn his r:^^ s<*- 
701/261 Rll/271 
teg atg acc aae ace ttg aee teg atg ttg aaq gge ttt 
^er met thr asn th: I re e": ee: Vu I ys elv oh* 1 



va 



-<'•— <«-y ^ w d : > ' ■ < T"? ~ TJ e r - - -gg geg atg 

-01/30: " ' " l ' ' ' 

■■61/321 ' ' ^ \ ' 'i 3*1 



agr 



a re J -i 1 a al. 



h 



WO 99/09186 



PCT/FR98/01813 



19/185 



GGA TCC TGA TGC AAG TGG TCC GGG ATT TGT 
gly ser OPA cys lys trp ser gl y ile cys 
61/21 

TTG GTG CAT CCG GGC TGC GAG CAT GCA CGC 
leu val his pro gly cys glu his ala arg 
121/41 

CTT GCC CAC TGT TCC TCC CTG CCG GCA CCA 
leu ala his cys ser ser leu pro ala pro 
181/61 

CCG GTG CCT GGG CAT CCA GCA AAA CGG GGA 
ala val pro gly his pro ala lys arg gly 
241/81 

TCA CCA ACG TCG AAA CCG ACG GTT GC : AGC 
ser pro thr ser lys pro thr val ala ser 
in 1 / 1 0 1 

GCT GTA CCC TCA CCG AAC GTG AGT CCC AC A 
ala val pro ser pr:> asn val ser pro thr 
361/121 

GCA GCC CAG CTC AA- GTG TCC CGC ACC ACT 
ala ala glu leu lys val ser arg thr thr 
■121/141 

GAA GGA GAA GAT C 

glu gly g!i: asp 



31/11 

CGG CAG CCA CCG CGG TCC CGT CGA CCA ACG 
arg gin pro arg arg ser arg arg pro thr 
91/31 

ACC GAC CAG CGC GGC GAG CGC GGC TAG CTG 
thr asp gin arg gly glu arg gly AMB leu 
151/51 

TGT GCG ACA AGC TTA AGC GCA GCA GTA CCG 
cys ala thr ser leu ser ala ala val pro 
211/71 

GCT CAA GAA CGA TTC ATG AAC GAG GGG TCG 
ala gin glu arg phe met asn qlu qlv sec 
271/91 

CGG CCC ACG ATA TTG CGT GCT CGA GGG TCC 
arg pro thr lie leu arc ala »m - 
331/111 ' " ^ J 

CCG CGG AGG CGG GCG ACT CTG GCG TCG TTA 
pro arg arg a:.q ala thr leu ala ser leu 
391/131 

GCC TCG AAT GCT TTT AAC CGA CCG GAT CCA 
val ser as:: ala phe asn arg pro asp pro 



SEQ ID N° 6A 
FIGURE 6A 



WO 99/09186 



PCT/FR98/01813 



20/165 



ATC CTG ATG CAA GTG GTC CGG GAT TTG TCG 
lie leu met gin val val arg asp leu ser 
63/21 

GGT GCA TCC GGG CTG CGA GCA TGC ACG CAC 
gly ala ser gly leu arg ala cys thr his 
123/41 

TGC CCA CTG TTC CTC CCT GCC GGC ACC ATG 
cys pro leu phe leu pro ala gly the met 
183/61 

G3T GCC TGG GCA TCC AGC AAA ACG GGG AG C 
gly ala trp ala ser ser I ys thr gly ser 
243/81 

ACC AAC GTC GAA ACC GAC GCT TGC CAC CCC 
thr asn val glu thr aso gly cys gin p-o 
303/101 

TGT ACC CTC ACC GAA CGT GAG TCC CAC ACC 
cys thr leu thr qlu arg qlu sei his thr 
363/121 

AGC CGA GCT CAA GGT GTC CCG CAC CAC TGT 
ser arg ala gin gly val ore his br s cvs 
423/141 

AGG AGA AG A TC 
arg arg arg 



33/11 

GCA GCC ACG GCG GTC CCG TCG ACC AAC GTT 
ala ala thr ala val pro ser thr asn val 
93/31 

CGA CCA GCG CGG CGA GCG CGG CTA GCT GCT 
arg pro ala arg arg ala arg leu ala ala 
153/bl 

TGC GAC AAG CTT AAG CCC AGC AGT ACC GGC 
cys asp lys leu lys arg scr ser thr qlv 
213/71 

TCA AGA ACG ATT CAT GAA CGA GGG GTC GTC 
ser arg thr :le his glu arg gly val val 
273/91 

3CC :3a_1 '^'J' --^ TGC TCG AGG GTC CGC 

ala his asp lie a 1 a cys ser arg val arq 
333/111 

:;CG GAG GCG GCC GAC TCT GGC GTC GTT AGC 
'3 lu C L y ser qly val val s--- 

3 9 3/131 

CTC GA-\ TTT TAA CCG ACC GGA TCC AGA 

ie;i • • : : " : - Pro th: gly s,-r arc 



SEQ ID N' J 6C 
FIGURE 6C 



WO 99/09186 



PCT/FR98/0I813 



21/185 



CGT CGG CAA CTT 
arg arg gin leu 
62/21 

GCG GCT CCA TCG 
ala ala pro ser 
122/41 

GGC CGG TGA TAT 
qly azg OPA tyr 
182/61 

GCC GCG GTG CTC 
ala ala va I leu 
242/01 

TTG TAT HT r ttC 
leu tyr leu phe 
302/101 

GGT TCA CCA GGT 
gly ser pro gly 



GGC CGC TGA GGT 
gly arg OPA gly 

GCT TTG CTG GTA 
ala leu leu val 

ATT GGG TCA GAC 
lie gly ser asp 

GAG CCA GGC TTA 
glu pro gly leu 

wrr- rmr. ^ ~ » ~ 

ser val pro pro 

CTC ACC AG A TC 
leu Lh: arg 



32/11 
CGG CTT GAT CCC 
arg leu asp pro 

92/31 
GCG GTT CGG CGG 
ala val arg arg 

152/51 
GGG TAT GGC GGC 
gly tyr gly gly 

212/71 
CCA CCA GGG AAT 
arg pro gly asn 

272/91 
^ AGG TGT ACT 
pro arg cys ser. 



TGG GCC GAG GCG 
trp ala glu ala 

GAA GCT AGC GGC 
glu ala ser gly 

GGC TGA GGT GAT 
qly OPA gly asp 

TTC GAA AAT GTT 
phe glu asn va ! 

GTT TTC GAG TAC 
v a ! p he q 1 u tyr 



GGT CAG CCA ATA 
gly gin pro ile 

GAC GTT GTC GGT 
asp val val gly 

CTG CGA CAC GCC 
leu arg his ala 

ATT CAG AAC ATC 
i. 1 f* gin asn ile 

CGG CAG ATC CCA 
arg gin lie pro 



SEQ ID N° 7B 
FIGURE 7B 



WO 99/09186 



PCT/FR98/01813 



22/1B5 



CTT TGC GTG ATG TCC AAT 
leu cys val met ser asn 
61/21 

TAG TTT TCG CGA TGA CGC 
AMB phe ser arg OPA arg 
121/41 

AGC GAA CCG TCG ATT CCA 
ser glu pro ser ile pro 
181/61 

CGT TCC TGG GTT CGA CAG 
arg ser trp val arg his 
241/81 

GCG TCT TGG CTG CCG CCL! 
ala ser tip leu pro pro 
301/101 

CGC GAA ACG TCA CCG CGT 
arg glu thr ser pro arg 
361/121 

ACG GTC GGG CGC CAT CGA 
thr val gly arg his arg 
•12 1/ Ml 

TC^ GCG ACO ATC 
so r a I a thr ile 



31/11 

GGC GAA AAC GAC GCC TTG TCA 
gly glu asn asp ala leu ser 
91/31 

TCG TTC TGA CCG GAC TTG TGA 
ser phe OPA pro asp leu OPA 
151/51 

TGG GTG TCG ACG CAT TCG TGG 
trp val ser thr his ser trp 
211/71 

CAT TCG CCC AAA TCG ACC TGC 
his ser pro lys ser thr cys 
271/91 

CAC TAG CGA CTG CGC CGT CGA 
his a>:b arg leu arg arg arg 
3 31/111 

TCG GGG CAC CAG AGC ACG GAC 
ser gly his gin ser thr asp 
39 1/ 131 

C'JC C G G AC 3 AGG TCG CGG TGT 
a i g a r. y Lhr arg ser arg c y s 



TCG CAA TCG TCA GCA CCG GCC 
ser gin ser ser ala pro ala 

ACG GGT TTC GGG TCG AGG CCG 
thr gly phe gly ser arg pro 

TCA AGG CCG GCG CGG CAG GAC 
ser arg pro ala arg gin asp 

CCC AGG TTG CTC GTG CGC CTG 
pro arg leu leu val arg leu 

CGA TCC GGC AGG GCA CGT CAG 
arg ser qly arg ala arg gin 

CCG GCA TGC CGC GGG TCT CGG 
pro ala cy^ arg gly ser arq 

CG.'\ GCA CGC TGG GCC GAA AGG 
arg ala arq trp ala glu thr 



SEQ ID N° 8A 
FIGURE 8A 



WO 99/09186 



PCT/FR98/018I3 



23/185 



TTG CGT GAT GTC CAA TGG CGA AAA CGA CGC 
leu arg asp val gin trp arq lys arg arg 
63/21 

GTT TTC GCG ATG ACG CTC GTT CTG ACC GGA 
val phe ala met thr leu val leu thr gly 
123/41 

CGA ACC GTC GAT TCC ATG GGT GTC GAC GCA 
arg thr val asp so: met gly val aso ala 
183/61 

TTC CTG GG? T23 ACA CCA TTC GCC CAA ATG 
phe leu gly ser thr pro phe ala gin lie 
243/81 

GTC TTG GCT GCC GCC CCA CTA GCC ACT GCC 
val leu ala aid d 1 d pro leu ala thr ala 
303/101 

CGA AAC GTC AC Z CCG TTC GGG GCA CCA GAG 
arg asn val thr ala phe qly ala pro glu 
363/121 

GGT CGG GCG 2CA TCG AC G CCG GAC GAG GTC 
qly arq ala ore se: thr oro as:) glu val 
423/141 

_ 

g I y asp a s p 



33/11 

CTT GTC ATC GCA ATC GTC AGC ACC GGC CTA 
leu val ile ala lie val ser thr gly leu 
93/31 

CTT GTG AAC GGG TTT CGG GTC GAG GCC GAG 
leu val asn gly phe arg val glu ala glu 
153/51 

TTC GTG GTC AAG GCC GGC GCG GCA GGA CCG 
phe val val lys ala gly ala ala gly pro 
213/71 

GAC CTG CCC CAG GTT G3T CGT GCG CCT GGC 
aiip le.i pro gin val ala arg ala pro gly 
273/91 

CCG TCG ACG ATC CGG CAG GGC ACG Tra GCG 
pro ser thr lie arg gin gly thr ser ala 
333/111 

CAC GGA CCC GGC ATG CC J CGG GTC TCG GAC 
his gly pro gly met on arg val ser asp 
393/13 ; 

GCG GTG TCG AGC ACG CTG GCC CGA AAC CTC 
ala val ser ser thr leu a I v arq a .s n leu 



SEQ ID N° 8C 
FIGURE 0C 



WO 99/09 J 86 



PCT/FR98/01813 



24/165 



1/1 

AGG TTG CTC GTG CGC CTG GCG TCT TGG CTG 

arg leu leu val arg leu ala ser trp leu 
61/21 

TCC GGC AGG GCA CGT CAG CGC GAA ACG TCA 

ser gly arg ala arg gin arg glu thr ser 
121/41 

G:A TGC CGC GGG TCT CGC ACG GTC GGG CGC 

ala cys arg gly ser arg thr val gly arg 
131/61 

G:A CGC TGG GCC GAA ACC TCG GCG ACG ATC 

did aig Lip ala glu thr ser ala thr lie 



31/11 

CCG CCC CAC TAG CGA CTG CGC CGT CGA CGA 

pro pro his AMB arg leu arg arg arg arg 
91/31 

CCG CGT TCG GGG CAC CAG AGC ACG GAC CCG 

pro arg ser gly his gin ser thr asp oro 
151/51 

CAT CGA CGC CGC ACG AGC TCG CGG TCT CGA 

hib d;,; arg arg thr arg ser arg cys arg 



SEQ ID 8B' 



FIGURE 83' 



WO 99/09186 



PCT/FR98/01813 



25/1B5 

sequence Hv2563 predite par Cole et al . (Nature 393:537-54-1] ct co-tenan t seqSA' 

atg 
met 

121/41 151/51 

ctt tec gcg get ttg cgt gat gtc caa tgg cga aaa cga cgc ctt gtc ate gca ate gtc 
leu phe ala ala leu arg asp val gin trp arg lys a rg arg leu val ile ala lie val 
181/61 211/71 

age acc ggc eta gtt ttc gcg atg acg etc gtt ctg acc yyu ctt gtg aac ggg ttt egg 
ser thr gly leu val phe aJa met tbr J eu va.l leu thr gly leu val asn gly phe a ^ 
241/81 27 1 /91 Ll ^ 

gtc gag gee gag cga acc gtc gat 'ccc atg ggt gtc qac gca ttc gtg gtc aag 
val glu ala giu arg thr val asp ser met gly val asp ala phe val val ivs ala ql-- 
301/101 3 31 '111 * '* 

gcg gca gga ccg ttc ctg ggt teg aca cca ttc gee caa arc qac ctg c.rc cag gt- g,- 
ala ala gly pro phe leu gly ser thr pro phe ala gin :I e asp leu pm gle val ala 

3 0 1 / 1 2 1 3 9 L ''131 

egt gcg cct ggc gtc ttg get gee gee eea eta gcg 3 ;:t g,g c::g teg acg ate egg cag 
arg ala pro gly va. leu ala ala ala pro leu a_.a thr a], pro ser thr lie arg ain 

4 21/14 1 451/151 

ggc aq tea gcg cga aac gt.c acc gcg ttc gg. 7 g „ ,,,, , , gga c „ c . g „ aL , rr 

•«wi^ arf ' V< ' : 313 ?ne 3ly Jla ri ° C!lu h: " "et oco 

<i o 1 / 1 6 1 511/17 1 

egg gtc teg qac ggt egg gcg eea teg aeg c,g ca, gag - grr; gtc, tc:; age ace ctg 

arg val ser asp gly arg ala pro eer tnr pro aac ale cl la val s-r ^ ; Wmi 

541/181 D71/191 " 

ggc cga aac etc gge gac gat ctg caa gtg ggt gcg ccc a::t ttg egg a-- g- - g~~ a — 

gly arg asn leu gly asp asp leu gin val gly ala arg thr leu arg He va " qlv lie 
601/201 ^ 



0 3 : 



gtg ccc gag tea ace gcg ctg gea aag att c , a. • a: a t — eta a.e ace gaa gg~ rta 

va^ pro gle ser thr ala leu ala Ivs ile :c') a-.r — ■ ' . t h- ni„ -i,, ' 

6G1/221 ' 6,:/2- * 9 * V ^ 

cag cag ttc gea tac a a : gg cac ccg aca ate • * : - : : ; ate c:ae ccc atg 

g 1 e qln leu ala tvr ann crv e^ rro ■ ■ - ■ . ■ - ' . , *- ' " ^ ' 



WO 99/09186 PCT/FR98/01813 



26/185 

ORF predite par_Cole et al . (Nature 393:537-544) ot co-tenant Rv?563 
1/1 31/11 

tag gtt tea aga agg cct gtg cag gtt tec gca gec tgg gec gcg gcg cca ccg aag age 
AMB val ser arg arg pro val gin val scr ala ala trp aia ala ala pro pro l y3 ser 
61/21 91/ 3I 

ccg ccg aaa tgg get aat egg gtt cgc ttg get cga teg ccg atg ate teg acc gec acq 
pro pro lys trp ala asn arg val arg leu ala arg ser pro met lie scr thr ala th* 
121/41 151/51 



acc gac 
thr asp 
131/61 


ccc 
pro 


etc 
leu 


acc 
thr 


teg 
ser 


gtc 
val 


gaa 
glu 


cct 
pro 


egg 
arg 


cga acc 
arg thr 

211/71 


aac 
asn 


gcg 
ala 


gca 
ala 


acg 
thr 


cca 
pro 


gec 
ala 


cat 
his 


gat 
asp 


cat ttg 
his leu 
241/81 


att 
lie 


ggg 

gly 


tec 
ser 


acg 
thr 


gaa 
g.lu 


gca 
ala 


ggt 

gl y 


age 
se r 


ttc cgt 
phe arg 
271/91 


cgc 
arg 


atg 
met 


ctt 
ieu 


ttt 
phe 


gcg 
al a 


get 
ala 


ttg 
leu 


cgt 
arg 


gat gtc 
asp val 
301/101 


caa 
gin 


tgg 
trp 


cga 
arg 


aaa 
lys 


cga 
arg 


cgc 
arg 


ctt 
leu 


gtc 
val 


ate gca 
lie ala 
331/111 


ate 
lie 


gtc 
va 1 


age 
ser 


acc 
thr 


ggc 
gly 


eta 
leu 


gtt 
val 


ttc 
phe 


gcg atg 
aid itet 
361/121 


acg 
thr 


etc 
ieu 


gtt 
val 


ctg 
leu 


acc 
thr 


gg^ 

gly 


leu 


gtg 
val 


aac ggg 
asn gly 
391/131 


r.t r 
phe 


cn n 

arg 


n r r~ 

va 1 


ga g 
glu 


-j - 
ala 


gag 
glu 


arg 


dv U 

thr 


gtc gat 
val asp 
421/141 


tec 
ser 


atg 
rr.c t 


ggt gtc 
gly val 


gac 
asp 


gca 
ala 


ttc 
phe 


gtg 
va 1 


gtc aag 

val lys 

i J 1/ K> i 


ccc 
a 1 a 


y -i «- 
gly 


gcg 
ala 


gca 
ala 


gga 
gly 


ccg 
pro 


ttc 
phe 


ctg 
leu 


ggt teg 
gly ser 
49 1/161 


aca 
thr 


c:a 
pro 


ttc 
phe 


gec 
ala 


caa 
gin 


ate 
lie 


gac 
asp 


c t g 
lea 


ccc cag 
pro gin 
j 1 1/ i l 


g t 
va 1 


jr. ;: 
aia 


cgt 
arg 


gcg 
ala 


cc t 
pro 


ggc 
gly 


gtc 
val 


ttg 
leu 


get gee 
ala ala 
54 1/181 


gec 
ala 


cca 
pro 


eta 
leu 


gcg 
ala 


act 
thr 


gcg 
ala 


ccg 
pro 


teg 

se r 


acg ate 
thr lie 
571/191 


egg 
arg 


cag 
gin 


ggc 
gly 


acg 
thr 


tea 
ser 


gcg 
aia 


cga 
arg 


aac 
asn 


gtc acc 
val thr 

601/201 


gcg 
ala 


ttc 
phe 


ggg 

gly 


gca 
ala 


cca 
pro 


g^g 

glu 


cac 
his 


gga 
gly 


ccc ggc 
pro gly 
631/211 


atg 


ccg 
pro 


egg 
arg 


gtc 
val 


teg 
ser 


gac 
asp 


ggt 
gly 


egg 
arg 


gcg cca 
ala pro 
661/221 


teg 
se r 


acg 


ccg 
pro 


gac 
asp 


gag 
glu 


gtc 
va! 


gcg 
ala 


gtg 

va 1 


teg age 
ser scr 
6917231 


acg 
thr 


ctg 
leu 


gg c 
gly 


cga 
arg 


a a c 
asn 


etc 
leu 


ggc 
gly 


gac 
asp 


gat ctg 
asp ieu 
721/241 


caa 
gin 


ctg 
vil 


ggt 
gl y 


gcg 
al a 


cgc 
arg 


act. 
thr 


ttg 
leu 


egg 
arq 


ate gtc 
lie va 1 
751/25 1 


ggc 
gly 


a t c 
l i e 


gtg 


pro 


gag 
glu 


tea 
se r 


acc 
thr 


gcg 
aia 


ctg gca 
leu ala 
7 3 1/2 61 


aag 

- y 1 


ar. z 


ccc 


aac 
a s p. 


at c 
:. 1 e 




ctg 
1 e u 


acc 

*- V-i r ~ 


acc gaa 
011/271 


^ i 


z a 




cag 




gca 
a 1 a 


z a z 


a a c 
a ^ c 


gga cag 




a ; a 




a :; ' ■ 


rr (] 


a r r 




at j 


gac gcg 


a t g 






ca g 










gly gin 
e 4 1 /2 3 1 


pro 




lie 






1 1 0 


qiy 


lie 


asp gly 

8 7 1/.:-; 




p : ■. 'j 


arg 


gl n 






a p 


g i y 


*: i t c a g 

:■ : l /' 3 c : 


a c . 




a ■ i z 


cc i 
a :" ; 




a -~ : 


i ' _\ 


Ct. c 
'.' \ 1 


a:;c 

s e r i .-" :" 

9 3 1 /' i : 




a ' " : 


a : ; 




* T -; 




Y i 1 


















*i t : 























*u arg 



WO 99/09186 



PCT/FR98/01813 



27/185 

sequence de Rv0C7? predite par par Cole et ai . (Nature 393 : 537-544) e - 
presentant plus de 773 de similarite avec Seq8D' 
I'l 31/11 

atg etc tec gcg gec ctg cgt gac atg caa tgg aga aag cgc cgc cLg gtc ate acg ate 
Met leu phe ala ala leu acg asp met gin trp arg lys arg arg leu val ile thr ile 
61/21 91/31 

ate age ace ggg ctg ate ttc ggg atg acg ctt gtt ttg ace gga etc gcg aae gge ttc 
Ue ser thr gly leu He phe gly met thr leu val leu thr g] y leu ala asn gly phe 
121/41 151/51 

egg gtg gag gee egg cac ace gtc gat tec atg ggt gtc gat gta ttc gtc gtc aga tec 
arg val gin ala arg his thr val asp so, mot gly v.l as P val phe vai val arg s,r 

1 o 1 / o 1 211/71 

gge get get gga cet ttt ctg ggt tea ata ccg ttt ccc gat. gtt gae ctg gee ega gtg 
gly ala a. a gly pro phe leu gly ser Ho pro phe pro asp val asp leu ala arg val 
,.-,1/91 271/91 

qcc get yaa ccc ggt gtc atg gec gcg gec ccg ttg gge age gtg ggg acg ate atg aaa 
a a ala glu pro gly val rr.et ala ala ala pro leu gly ser val gly thr He met lys 
30./10x 331/111 

caa gge acg teg aeg ega aae gte acq gte ttc gge gcg ccc gag ,ac gga ect gge atg 
glu g.y ,hr ser thr arg asn val thr val phe gly als pro glu his gly oro gly r.r 
joI/12^ 391/131 

cca egg gte tea gag ggt egg tea ccg teg aaa ecg gae gaa gte gcg gea teg age ar Q 
pro arg val ser glu gly arg ser pro ser lys pr 3 asp glu val ala ala ser ser tnr 
•"•l/-"-''- 451/151 

atg gg:: ega cac etc ggt gae act gtc gag gtc gge gcg cgc aga ttg C gg g - c yLL gqc 

TJ,U gly aSp thr Val « lu val ala arg arg leu acg. val val'jly. 

4B1/1D. 511/171 w 

att gtg ccg aat tec acc qeg ctg gee aag ate ccc act gtc ttc etc acg aec gag gq. 

Pr ° thr ala iSU aIj !V= Pro asn val phe leu t.hr thr glu gly 

' ta C f 7 " g g ^ 5 LdCI aac m C3g CC ? ^ *cj tec ate cjqq ate ata ggt atg 

leu gin .ya leu ala tyr asn gly gin pro as:; i ] thr ser lie gl- , 1 - e r'v - -t 

601/20 1 63:/:^ ' "~ 

ccc ega eag ctg ccg gag ggt tac caq act tt:: c 

rro arg qi:i leu pro glu glv tvr gin thr oh.-. • 

CG 1/22.1 ' ' ' ' 631/: 

gtg zg~. CC3 ttg aag jzc gca gtg aat teg a r r- t 

val arg pro ltru lyr, val ala val asn ser : 



egg gtg gga gc: ? . g t aat ga- 
irg val gly ala val as;; t > i , : 



° val ?.la vnl lea lea 



W O 99/09186 



PCT/FR98/0I81J 



28/185 



Seq8H : ORF predite par Cole et al . (Nature 393:537-544) et contenant seqSG 
1/1 31/11 

tag cct ctg gga atg etc ttc gcg gec ctg cgt gac atg caa tgg aga aag cgc cgc ctg 
AMB pro leu gly met leu phe ala ala leu arg asp met gl n tcp arg lys a£g at g le u 
61/21 91/31 

gtc ate acg ate ate age ace ggg ctg ate ttc ggg atg acg ctt gtt ttg acc gga etc 
val He thr He lie ser thr gly leu ile phe gly met thr leu val leu thr qlv leu 
121/41 151/51 

gcg aac ggc ttc egg gtg gag gec egg cac acc gtc gat tec atg ggt gtc gat gta ttc 
ala asn gly phe arg val glu ala arg his thr val asp ser mot gly val ,- sp va ' v le 
181/61 211/71 ~ 

gtc gtc aga tec ggc get get qga cct ttt ctg ggt tea ata ccg t.tt ecc gat gtt qac 
val val arg ser gly ala ala gly pro phe leu gly ser lie pro phe pro asp val asn 
2 4 1/31 271/ 9 1 

ctg gec cga gtg gec ya ya. c;c:c ggt gtc atg gee gcg gec ccg ttq qgc age gtg ggg 
leu ala arg val ala ala glu pro gly val net ala ala ala pro leu gly ser val gly 
301/ 101 331 '1 I 1 

acg ate atg aaa gaa ggc acg teg acq cga aac gte acg .; t - t;te ggr e-q c — qa- 
thr lie rr.et lys glu gly thr ser tar arg ar-n val :,:.r val ~ 



351/121 



391 '13 1 



e g 1 y a 1 a p i. o g 1 u h : : 



gga ,ct ggc atg cca egg gtc tea gag ggt egg tea ~rg .eg aaa ccg gac gaa gt^ g C q 
g,y pro gly net pro arg val ser glu gly arq s,-r ;>:e se: lys aso M 

-121/141 451 Ibl ' 

yea tcy age acg atg 7 gc cga eac etc ggt gac act gtc gag gtc ggc gcg cgc aga tt 

asp thr 
511 '171 

egg gtc gtt ggc att gtg ccg aat tee acc 



- - - ' ■< j -j"- - — a--- ml- 1 - qgc gcg 

ala ser ser thr met gly arg his leu gly asp thr val glu val qlv ala 



, fl1/1 , d y xcu a ^ Lnr vai 9 iu vai gly ala arq arg leu 
4 b 1 / 1 o 1 5 1 1 ' I 7 1 

T ' : c: 3 : - : : aat gtc ttc etc 

aiy vax vci. 'jiv ± ^ e vji o r o a s n s e r t n r a ; a i >■ ■ ■ i 1 , 1 ■ * i lt . , i . i 

541/181 * f)/ T io; ^° asri val Phe leu 



acg ace gag ggc ttd cag aaa t.:g gee tac aae : : : : : ; a- at - a— t- a — 
thr thr }lu tIv leu q 1 a l.ve leu ala h V . c «^- - — — - - , - -> . 

601/201 ' ' /7 ; - • "~ Ser qly 



ate ata atg cec cga cag ctq cca qag ggt ta : ai ; a. ' • 



, , - : -» -i ^ ' ~ : q.i' eg- gtg C ;ge gc 

... I e g_y -et pro arg em i eu pro qlu el',' : v : - 1 r, - : ; : r ~ ' " " 



061/221 

gtc aat gat ttj 



val asri asp leu val arq cro leu ly- val ala v ; • iv. ■ <- o i ~ i 

721/241 - ' ' ' J : ' v ' al 



WO 99/09186 



PCT/FR98/01813 



29/185 



CGA GGC CGA GCG AAC CGT CGA 
arg gly arg aid asn arg arg 
61/21 

GGC AGG ACC GTT CCT GGG TTC 
gly arg thr val pro gly phe 
121/41 

TGC GCC TGG CGT CTT GGC TGC 
cys aia trp arg leu gly cys 
161/61 

CAC GTC A jC GCG AAA CGT CAC 
his val s'jr ala lys arg his 
241/91 

GGT CTC GGA CGG TCG GGC GCC 
gly leu gly arg s e r ^ 1 y aia 
301/101 

CCj AAA CCT CGG CGA CGA TC 
prD lys pro arg arg arg 



31/11 

TTC CAT GGG TGT CCA CGC 
phe his gly cys arg arg 
91/31 

GAC ACC ATT CGC CCA AAT 
asp thr lie arg pro asn 
151/51 

CGC CCC ACT AGC GAC TGC 
arg pro thr ser asp cys 
211/11 

CGC GTT C3G GGC ACC AG A 
arg val arg gly thr arg 
2 7 1/91 

ATC GAC GCC GGA GGA GGT 
lie asp aia gly arg g ] y 



ATT CGT GGT CAA GGC CGG CGC 
ile arg qly gl n gly arg arg 

CGA CCT GCC CCA GGT TGC TCG 
arg pro ala pro gly cys ser 

GCC CTC GAC GAT CCG GCA GGG 
ala val asp asp pro ala gly 

GCA CGG ACC CGG CAT GCC GCG 
ala arg thr arg his ala ala 

CGG GGT GTC GAG CAC GCT GGG 
arg gly val glu his ala gly 



SEQ ID N 3 9A 
FIGURE 9A 



WO 99/09186 



PCT/FR98/01813 



30/185 



AGG CCG AGC GAA CCG TCG 
arg pro ser glu pro ser 
63/21 

CAG GAC CGT TCC TGG GTT 
gin asp arg ser trp val 
123/41 

CGC CTG GCG TCT TGG CTG 
ara leu si a ser trp leu 
183/61 

CGT CAG CGC GAA ACG TCA 
arg gin arg glu thr ser 
243/01 

TCI' CGG ACG GTC GGG CGC 
ser arg thr val gly arg 
303/101 

GAA ACC TCG GCG ACG ATC 
glu f Ji:.ser ala thr lie 



33/11 

ATT CCA TGG GTG TCG ACG CAT 
ile pro trp val ser thr his 
93/31 

CGA CAC CAT TCG CCC AAA TCG 
arg his his ser pro lys ser 
153/51 

CCG CCC CAC TAG CGA CTG CGC 
pro pro his AKB arg leu arg 
213/71 

CCG CGT TCG GGG CAC CAG AGC 
pro arg ser gly his gir. ser 
273/91 

CAT CGA CGC CGG ACG AGG TCG 
nis arg arg a::;; t.hr arg ser 



TCG TGG TCA AGG CCG GCG CGG 
ser trp ser arg pro ala arg 

ACC TGC CCC AGG TTG CTC GTG 
thr cys pro arg leu leu val 

CGT CGA CGA TCC GG~ AGG GCA 
arg arg arg ser gly d r ^ aid 

ACG GAC CCG GCA TGC CG: GGG 
thr. asp pro ala cys arg gly 

CGG TGT CGA GCA CGC TGG GCC 
arg cys arg ala arg trp ala 



SEQ ID N u 9C 
FIGURE 9C 



31/11 

TTA ACG ACT CAG ACG GAA ACG CTT GAA CCG CGA GGT C./J TCJ GGA CAC CAA T^ 
leu thr thr gin thr glu thr leu glu pro arg yly arg sor gly his gin pho 

? 1 / 3 1 



61/21 



GAC TCG 
asr ser 



WO 99/09186 



PCT/FR98/0I813 



31/185 



TAA CGA CTC AGA CGG AAA CGC 
OCH arg leu arg arg lys arg 
62/21 

CTC TTT GGC AAT TGA AGG TGA 
leu phe gly asn OPA arg OPA 
122/41 

TCA ATC GCC GGC TCG CGG ACG 
ser ile ala gly ser arg thr 
192/61 

GGT CCT TTG TG*\ CTG CCG GGC 
gly pro leu OPA leu pro gly 
242/81 

TAG CGT TCT GAC CTG GGG CTG 
tyr arg ser asp leu gly leu 
JUJ/iOi 

GCC CAC CGC GAC CTC GGT CGC 
a l-i his arg his leu gly arg 
362/121 

TTG TTC GCA TCG TTG GTG TCG 
leu pnc ala ser leu vai ser 
422/141 

GCG GTC GTG CCG CGC AT G CGG 
ala val val prr> arg rr.et arg 



32/11 

TTG AAC CGC GAG GTC GCT 
leu asn arg glu val ala 
92/31 

GCT GCG AGC AGC CGG GTG 
ala ala ser ser arg val 
152/51 

TAG ATA ATC AGC TCA CCG 
AMB ile lie ser ser pro 
212/71 

TTG AO^ CGG ACG ACC A'ZA 
leu thr arg thr thr thr 
272/91 

CGT GG 1, CGC CGA CGA CGT 
arg gly arg arg arg n^n 

332/111 
CGG CAG TAT GT : AGC ATG 
arg gin tyr vai ser :-el 

392/131 
TGG TTC CGA CGA CCT TGG 
tip leu arg arg pro trr> 

ATC 
lie 



CCG GAC ACC AAT TTG ACT CGG 
pro asp thr asn leu thr arg 

ACC GCA TCG TTG GCC TTG CCA 
thr ala ser leu ala leu pro 

TTG GGA CCG ACC TCG ACC AGG 
leu gly pro thr ser thr arg 

GAG TCG GTC ATC GCC TAA GG C 
glu ser val ile ala OCH gly 

GAG G2A CGT CAT GTC TCA GCG 

TGC AGA TGA CTC CAC GCA GCC 
<::ys arg OPA leu his ala ala 

CGC TGG TGA GCG CAC CCG CCG 
arg trp CPA ala hi s pro pro 



SEQ ID N° 10B 
FIGURE 10B 



WO 99/09186 



PCT/FR98/01813 



32/185 



CCC GAA GAG GTC CCC CGT TTT 
pro glu glu val pro arg phe 
61/21 

AAG GCA TAA AAC CTA GTA CCT 
lys ala OCH asn leu val pro 
121/41 

GGG GCG TGC ATT CCG ACG ACC 
gly ala cys lie pro thr thr 
181/61 

ACG AAG GCC GAG CGA CGG GCT 
thr lys ala glu arg arg ala 
241/81 

CAC CAC CGC CCG CAC CCG AC C 
his his arg pro his pro thr 

301/101 

GCT GGA CAG CAT CGG TCC CCC 
ala gly gin his arg ser pro 
361/121 

CAA CCC CTG AAC CGG GTC CCG 
gin pro leu asn arg val pro 
42 1/14 1 
AG A ca: 

arg his arj ala met glu lie 
48 1/161 

CGG TCG CTG AGC TTC TAG CGT 
arg ser leu ser phe tyr arg 



31/11 

GTT AAT TTT TAA AAA ATT 
val asp phe OCH ly3 lie 
91/31 

GGG GCG GCG GAT TCA ACG 
gly ala ala a3p ser thr 
151/51 

CTG TAC GAC CCG CTG GTG 
leu tyr aap pro leu val 
211/71 

GCC GGC GCT GAC CGC CGC 
ala g] y ala asp arg arg 
271/91 

GGT ACG GAT CGC GCC TCG 
gly thr asp arg aid at;r 
331/111 

leu gly gin zys thr hir, 

391/131 
GCC TGC CGA CCC TCG GCC 
aid 'j, y j a r q pro s p r ala 

451/151 
CTG >CC AGC CGG ATG CTA 
leu ala ser arg ^et ioj 

GAC CAG ATC 
dsp gin lie 1 



TGT GTC ACA AAC CGG GGT ACC 
cya val thr lya arg gly thr 

AAA ACC GAG TGG GGG TAG TCA 
lys thr glu trp gly AMB ser 

GCA ACG CCG ATG AGT GCG CCG 
ala thr pro met ser ala pro 

GGA AGC CGC CGA GTG CAT GGT 
gly ser arg r.rq vaj asp gly 

CGT TAC CGT CGC CGT CAA CGC 
gly tyr arg arg arg gin arg 

^. A GCG CCG CAA CGA ACA GCT 
ala ala pro gin dry thr ala 

GCC GGC GTG CCG CTA CGT GAT 
l i'V Vtl i pro leu arg asp 

GTC CGG CCG GCG GAC TAT CAG 
■ v - 1 ' ' J p:o ala a.sp tyr gin 



SEQ ID N° 11A 



FIGURE HA 



W 0 99/09186 



PCT/FR98/01813 



33/185 



CGA AGA GGT CCC CCG TTT TGT 
arg arg gly pro pro phe cys 
63/21 

GGC ATA AAA CCT AGT ACC TGG 
gly ile lys pro ser thr trp 
123/41 

GGC GTG CAT TCC GAC GAC CCT 
gly val his ser asp asp pro 
183/61 

GAA GGC CGA GCG ACG GGC TGC 
glu gly arg ala thr gly cys 
243/81 

cca ccg ccc gca ccc ga: CGG 

pro pro pro ala pro a so arg 
303/101 

TGG ACA GCA TCG GTC CCC GCT 
trp thr ala ser val oro ala 
363/121 

ACC CTT GAA CCG GGT CCC GGC 
thr leu glu pro jly pro gly 
423/141 

ACA CAG GGC CAT GGA AAT CCT 
thr gin gly his gly asn pro 
483/161 

GTC GCT GAG CTT CTA CCG TGA 
val ala glu leu leu pro OPA 



33/11 

TAA TTT TTA AAA AAT TTG 
OCH phe leu lys asn leu 
93/31 

GGC GGC GGA TTC AAC GAA 
gly gly gly phe asn glu 
153/51 

GTA CGA CCC GCT GGT GGC 
val arg pro ala g]y gly 

213/7f 
CGG CGC TGA CCG CCG CGG 
arg ar? OPA pn pro arc; 

? 7 ? / Q 1 

TAC GGA TCG CGC GTC GGC 
tyr gly scr arg leu g] y 

33 3/111 
GGG TCA ATG CAG TCA TGC 
gl y s e r me t n : r, s e r c y 

393/131 
CTG CCG ACC CTC GGC CG 
leu pro thr ...eu gly AL 

4 53 / 151 
GGC CAG CCG GAT GCT AC 
gly gin pro asp ala t h 

CCA GAT C 
pro asp 



TCT 


CAC 


AAA 


GCG 


GGG 


TAC 


CAA 


cys 


his 


lys 


ala 


gly 


tyr 


gin 


AAC 


CGA 


GTG 


GGG 


GTA 


GTC 


AGG 


asn 


arg 


val 


gly 


val 


va 1 


a rg 


AAC 


GCC 


GAT 


GAG 


TGC 


GCC 


GAC 


asn 


ala 


asp 


ol u 


cys 


ala 


asp 


AAG 


CCG 


CCG 


AGT 


GGA 


TGG 


TCA 


ly. 


pro 


pro 


ser 


gly 


trp 


ser 




CCG 


TCG 


CCG 


T C A 


ACG 




1 e u 


pro 


se r 


pro 


ser 


thr 


arg 






GCA 


ACG 


AAC 


AGC 


TCA 




ah 


ala 


t h r 


a 3 n 


ser 


ser 




v- G i 


GCC 




ACG 


TGA 


TAG 




arg 


ala 


a C a 




CPA 


A.VJi 




GCC 


o o ^ 


GGA 


CTA 


TCA 


GCG 


s ri r 


ala 


gly 


gly 


leu 




ala 



SEQ ID N J lie 



WO 99/09186 



PCT7FR98/0I813 



34/185 



1/1 

GTC GCC GTC AAC GCG 
val ala val asn ala 
61/21 

CGC AAC GAA CAG CTC 
arg asn glu gin leu 
121/41 

TGC CGC TAC GTG ATA 
cya arg tyr val lie 
181/61 

CGG CGG ACT ATC AGC 
arg arg thr lie ser 



CTG GAC AGC ATC GGT 
leu asp ser lie gly 

AAC CCT TGA ACC GGG 
asn pro OPA thr gly 

GAC AC A GGG CCA TGG 
asp thr gly pro trp 

GGT CGC TGA GCT TCT 
glv arg OPA ala ser 



31/11 

CCC CGC TGG GTC AAT 
pro arg trp val dsn 
91/31 

TCC CGG CCT GCC GAC 
ser arg pro ala a3p 
151/51 

AAA TCC TGG CCA GCC 
lya ser trp pro ala 
211/71 

ACC GTG ACC AGA TC 
thr val thr arg 



GCA CTC ATG CAG CGC 
ala leu met gin arg 

CCT CGG CCG CCG GCG 
pro arg pro pro ala 

GGA TGC TAC TTC GGC 

gly cys tyr phe gly 



SEQ ID N° 11B' 



FIGURE 11B' 



1/1 
















31/11 


















TCG CCG 


TCA 


AC G 


CGC 


TGG 


AC A 


GC A TCG 


GTC 


CCC GCT 


GGG 




ATG 


CAC 




TGC 


AGC 




ser pro 


ser 


thr 


arg 


trp 


thr 


ala ser 


val 


pro ala 


gly 


ser 


rr.e t 


his 


ser 


cys 


ser 


ala 


61/21 
















91/31 
















GCA ACG 


AAC 


AGC 


TCA 


AC C 


CTT 


GAA CCG 




C . GvrC 


CTG 


CCG 








CGC 


CGG 


CGT 


ala thr 


asn 


ser 


ser 


thr 


leu 


glu pro 


gly 


prD gly 


leu 


pro 


thr 


1 eu 


q] y 


arg 


arg 


arg 


121/41 
















151/51 














GCC GCT 


ACG 


TGA 


TAG 


AC A 


CAG 


GGC CAT 


GGA 


AAT CCT 


GGC 


CAG 




GAT 


GCT 


ACT 


TCG 


GCC 


ala ala 


thr 


OPA 


AM3 


thr 


gin 


gly his 


gly 


asn pro 


gly 


gin 


pro 


asp 


ala 


thr 


• 

ser 


ala 


181/61 
















211/71 
















GGC GGA 


CTA 


TCA 


GCG 


GTC 


GCT 


GAG CTT 


CTA 


CCG TGA 


CCA 


GAT 


C 












gly gly 


leu 


ser 


al a 


val 


ala 


glu leu 


leu 


pro OPA 


pro 


asp 















SEQ ID N° 11C 



FIGURE 11C 



WO 99/09186 



PCT/FR98/01813 



35/185 



ORF predite par par Cole et al . (Nature 393:537-544) et contenant Rv0546c 
1/1 31/11 

tag tea ggg cgt gca ttc gac gac get gta eta ccc get ggt ggc aac tec gat gat tgc 
AMB ser gly arg ala phe asp asp ala val leu pro ala gly gl y asn ser asp aso cys 
61/21 91/31 

gec gac gaa ggc eta cga egg get gec ggc get gac cgc cgc gqa age cgc cga gtg gar 
ala asp glu gly leu arg arg ala ala gly ala asp arg arg gly ser arg arg val asp 
121/41 151/51 

ggt cac cgc cgc ccg cac ccg acc ggt gcg gat cgc gec Leg gyt tgc cgt cgc cgt caa 
gly his arg arg pro his pro thr gly ala asp arg ala ser gly cys arg arg an qln 
131/61 211/71 

cgc get gga cag cat egg tec ccg ct.g ggt caa tgc act cat aca aca coi m» *<~, 

arg ala gly gin his arg ser pro leu gly gin cys thr his ala ala gin arc thr 

2 41/81 271/91 

9- r Caa Ccr tt( 3 aac C SJ $ tc cc <? 9cc tgc cga ccc teg gec gee ggc gtg ccg eta cgt. 
ala gin pre leu asn arg val pro ala cys arg pro so: ala ala giv va 1 p-o leu a-u 
301/101 331/111 * 

gat aga cac agg gee atg gaa ate ctg gee age egg atg eta ctt egg ccg gcg ga - ta- 
asp arg his arg ala met glu lie leu ala r,e: arg met leu leu arg pro ala aso 
3o 1/121 391/131 ' 

cag egg teg ctg age ttc tac cgt gac cag ate ggg ctg gcg att gee cgt gaa tac ggg 
g.n arg ser leu ser phe tyr arg asp gin He gly leu ala lie ala arg glu tyr qly 
421/141 451/151 

gec ggc aca gtg ttt ttc gec ggt cag tea ctg etc gaa ctg gec ggt. tac ngc gaq ccq 
ala gly thr val phe phe ala gly gin ser leu leu glu leu ala gly tyr q i v - ' u o4 
481/161 c t w i -r • ' y j * l J p.o 



;ac cat teg egg gga cet ttt ccc ggc gcg ctg tag ctg cag gtg cgc gac etc gag get 
isp his ser arg gly pro phe pro gly ala leu i.rp leu gin val arg aso leu qlu aU 
) 4 ] 1 1 8 1 t n i / i i 



511/171 

g 

a 

54 1/191 ' : 71/19'] 

acc cag ate gag ctg gte age cga gee gtg teg ate g z t. cgc gag ccc eg: cgc ga 

~ : ' r Ir; rh: 3 lu leu val ser ar 2 ^ly va l il--- al.j arg glu pre an arg gl 

tec cgc c* gag atg cat gtg aec it m g > • g g g ate aca :t ; at, ttc :t 

trp g.y leu his qlu :r.e f his val th: a.sc i r d-u, ■' ■ ' ^ 
6n-/22L ' bl/231 



h 



F I GURK 1 1 r 



WO 99/09186 



PCT/KR98/01813 



36/185 



1/1 

gac cga agg gat etc gcg act 
asp arg arg asp phe ala thr 
61/21 

gac gta gac agg aag aga cag 
asp val asp arg lys arg gin 
121/41 

gag tct ttr cga gtt cag caa 
glu se: nhe arg val gin a In 
181/61 

gcg gec egg gec get teg ggc 
ala ala arg a. la ala ser gly 
24 1/81 

gac aac cgc gcg gaa t.tc aat: 
asp asn arg ala glu phe asn 
301/101 

aac etc cgq agt gat c 
asn arg ser asp 



31/11 

aac teg gec tgt aag gca 
asn ser ala cys lys ala 
91/31 

gga age tga tga cgt cgc 
gly ser OPA OPA arg arg 
151/51 

caa teg aca cag aag egg 
gin ser thr gin 1 y.<; arg 
211/71 

cga gtg tct gag taa qae 
arg val ser glu OCH a:-;p 
2 71/91 

egg atg gcg gg- ggg a .zc 
arg met a: a gly gly thr 



SEQ ID N° 12A 
FIGURE 12A 



acq cga ggt ctt cat gec gag 
thr arg gly leu his ala glu 

gta ccg gac cgc cat tct gtc 
val pro asp arg his scr val 

gga cca gac egg gag gac gac 
gly pro adp arg glu asp asp 

cag agt: cac ggg tec gtg tgt 
gin s^r his gly ser val cys 

qga tt:g cgc egg tea ccg agg 
gly leu arg arg ser pro arg 




WO 99/09186 



PCT/FR98/01813 



37/185 



1/1 31/11 

ccg aag gga ttt cgc gac taa etc ggc ctg taa ggc aac gcg agg tct tea tgc cga gga 

pro lys gly phe arg asp OCH leu gly leu OCH gly dsn ala arg ser 3er cys arg gly 

61/21 91/31 

cgt aga cag gaa gag aca ggg aag ctg atg acg teg cgt acc gga ccg cca ttc tgt cga 
arg arg gin glu glu thr gly lys leu met thr ser arg thr gly pro pro phe cys arg 

121/41 151/51 

gtc ttt ccg agt tea gca aca ate gac aca gaa gcg ggg acc aga ccg gga gga cga cgc 

val phe pro ser ser ala thr lie asp thr glu ala gly thr arg pro glv qlv ara ara 

181/61 211/71 y y 

ggc ccg ggc cgc ttc ggg ccg agt gtc tga gta aga cca gag tea egg gtc cgt gtg tga 

gly pro gly arg phe gly pre ser val OPA val a.-rg pro glu ser arg val dr j vul CPA 

241/81 271/91 

caa ccg cgc gga att caa teg gat ggc ggg egg gac eg;; art gcg ccg gtc acc gag gaa 

gin pro arg gly ile gin ser asp gly gly arg asp an: :le ala P :o val thr qi u q 1 u 

301/101 ' y 4 

CCC CCy y<-ig lya t 

pro pro glu OPA 

SEQ ID N° 12C 
FIGURE 12C 



1/1 31/11 

GGG ATT TCG TTG CCC GAT GGA TTG TTT GTA CGG TTT GGC AAA AAC ACT T 1.A AGT C^T T m ~ 

gly ilo ser leu pro asp gly leu phe val arg pho glv Ivs asp. tr.r CPA s-r pro phe 
61/21 91/3: 

TAT TGG CAA TGC TGG AAA TGG ACA TTC CAA TAT TGC GCG AAT TAA CCG AAC ACG GTG AGG 

tyr trp gin cys trp lys trp thr phe gin tvr cvs ala v-,:i > H cro asn th- -a 1 ar- 

121/41 151/S1 * " 

GGG GGG CAA GCG TTT GTA CCG GGG CCA <3CA AGC GCC :T ; T A::: GAA CiCC AGr 

gly gly gin ala phe val pro gly pre. ala ser aid a I a asp arg l«u fir glu ala s-- 
131/61 711/7] 

ATG TTG TTG TGT "AG CCC GCG CTT GGT CTC GAT GTC GGG '• ' : TTG GCT C>':^ r^--* — 

rr.et leu leu cys gin arg gly leu gly leu as- val r; , i > u al > g i'v I ^ v , _1 

24 1/91 27 1/ 3 1 ' " * ' " 

TCA AAA CAG GTT GAA CTT AAC GA J TC A AC- A ACG GAA A , CTT ;,-, A -"g gr; A - . 7 — - 

:g:i/i:: 



acc ga: 

thr a:,; 



WO 99/09186 



PCT/FR98/018I3 



38/165 



GGA TTT CGT TGC CCG ATG GAT TGT TTG TAC 
gly phe arg cys pro met asp cys leu tyc 
62/21 

ATT GGC AAT GCT GGA AAT GGA CAT TCC AAT 
ile gly asn ala gly asn gly his ser asn 
122/41 

GGG GGC AAG CGT TTG TAC CGG GGC CAG CAA 
gly gly lys arg leu tyr arg gly gin gin 
182/61 

TGT TGT TGT GTC AGC GCG GGC TTG GTC TCG 
cys cys cys val ser ala gly lea val ser 
242/81 

CAA AAC AGG TTG AAC TTA ACG ACT CAA CAA 
gin asn arg leu asn leu thr thr gin glu 
302/101 

GAC ACC AAT TTG ACT CGG CTC TTT GGC AAT 
asp thr asn leu thr ar:j leu ohe gly asn 
362/121 

GCA TCG TTG GCC TTG CCA TCA ATC GCC GGC 
ala ser leu aid leu ;>ro ser ile ala gly 
422/141 

GGA CCG ACC TCC ACC AG 3 GGT CCT TTG TGA 
gly pro thr ser thr arg gly pro leu OPA 
482/161 

TCG GTC ATC GCC TAA GGC TAC CGT TCT GAC 
ser val ile ala CCH gly tyr ar 3 ser aso 
542/131 

GCA CGT CAT GTC TCA GCG GCC CAC CGC CAC 
ala arg his val ser ala ala his arg his 
602/201 

AGA TGA CTC CAC GCA GC':; TTG TTC GCA TCG 
a r :,: O PA leu his ala a 1 a leu p h e a i a s e : 

TGG TGA G^"G CAC CCG CCG GCG GTC GTG CCG 
r. rp CPA a"! a his pro pro ala val val pre 



32/11 

GGT TTG GGA AAA ACA CTT GAA GTC CTT TTT 
gly leu gly lys thr leu glu val leu phe 
92/31 

ATT GCG CGA ATT AAC CGA ACA CGG TGA GGG 
ile ala arg ile asn arg thr arg OPA qlv 
152/51 

GCG CCG CCG ACC GGT TGA CCG AAG CCA GCA 
ala pro pro thr gly OPA pro lys pro ala 
212/71 

ATG TCC CGG CCT TGG CTG GAC CCG CTT CTT 
met ser arg pro trp leu asp pro leu leu 
272/91 

CGC AAA CGC TTC- AA.C CGC C\C CTC G~T 
arg lys arg leu asn arg asp val ala pro 
332/ 11 1 

TGA AG 1 TGA GCT GCG AGC AGC CGG GTG ACC 
OPA arj CPA ala ala ser ser arg va -h- 
392/131 

TCG CGG ACG TAG ATA ATC AGC TCA CCG TTG 
ser ar] thr AM 3 lie ile ser ser pm i cu 
452/151 

CTG U-Cj GGC TTG ACG CGG ACG ACC ACA CAG 
leu pro gly leu thr arg thr thr thr glu 
512/17: 

CTG GGG ITG CGT GGG CGC CGA CGA CGT GAG 
leu g]y ;pm arg gly arg arg arg ara glu 
572/19 1 

CiC GGc CGG CAG TAT GTC A^Z ATG TGC 

leu gly arq arg gin tvr val s-r rr-t <--s 
632/211 

: ^ v*<j l ... G TGG TTG CGA CGA CCT TCG CGC 

692/231 " ^ 1 ^ ' fcJ '" d * ' L 

CGC ATC CGG AT ~ 
ar:; arg 1 1 -> 



SEQ ID 



1 IB 



WO 99/09186 



PCT/FR98/018I3 



39/185 



GAT TTC 


GTT 


GCC 


CGA 


TGG 


ATT 


PTT 
oil 


TPT 




ui I I GG 


GAA 


AAA 


CAC 


r ^ n nhp 

u O Ly 1 I 




ala 


arg 


crp 


lie 


va j. 


cys 


tnr 


val trp 


glu 


lys 


his 




















93/31 




TTG GCA 


ATG 


CTG 


HAA 








LLA 


ATA 


TTG CGC 


GAA 


TTA 


ACC 


1 eu did 






glu 


me t 


asp 




p ro 


lie 


leu arg 


gl u 


leu 


thr 


123/41 


















153/51 






GGG GCA 


AGC 


GTT 


TGT 


ACC 




ppp 




AAG 


CGC CGC 


CGA 


CCG 


GTT 


gly ala 




va j. 


cys 


tnr 


gly 


a 1 a 


ser 


1 vs 


arg arg 


arg 


pro 


val 


183/61 


















213/71 




GTT GTT 


GTG 


TCA 


GCG 


CGG 


PPT 


1 wo 


TCT 


CGA 


*CjI ccc 


■jG c 


CTT 


GGC 




val 


s & r 


did 


arg 


ala 


trp 


ser 


arg 


cys pro 


gly 


leu 


gly 


^ 4 3 / u 1 


















273/91 






AAA ACA 


GGT 


TGA 


ACT 




pp a 


^ j. ^ 


AAG 


AAC 


GGA AAC 


■j C T 


TGA 


ACC 


1 y 3 tnr 


gly 


w h /\ 


cnr 


OCH 


arg 


leu 


iys 


asn 


y 1 y asn 


ala 


OPA 


tnr 


ACA CCA 


ATT 


TGA 










GCA 


ATT 


333/1 1 1 












1 i 


i w 


GAA GGT 


GAG 


CTG 


CGA 


L h r p t o 


lit. 


0 PA 


1 RU 


gl y 


ser 


leu 


ala 


lie 


glu gly 


glu 


leu 


arg 


3 63/121 


















3 9 3/131 






CAT CGT 


TGG 


C GT 


TGC 


PAT 


PAH 






GCT 


CGC GGA 


C GT 


AG. A 


TAA 


his arg 


trp 


V ro 


CVS 


hi s 


aln 




pro 


a i a 


arg gly 


arg 


arg 


OCH 


423/141 


















453/151 




GAC CGA 


CCT 


CGA 


CCA 


GGG 


GTC 


CTT 


TGT 


GAC 






TGA 


CGC 


asp arg 


pro 


arg 


pro 




Vd 1 


leu 


cys 


asp 


cys arg 


ala 


3 PA 


arg 


483/161 


















513/17 1 






CGG TCA 


TCG 




AAG 


:ct 


ACC 


GTT 




ACC 


TGG GGC 


. o ^ 


GTG 


GGG 


arg ser 


ser 


pro 


^ y ^ 


ai a 




val 




thr 


-rp gly 


:ys 


va 1 


gi v 


543/181 


















5 7 3/1-91 






CAC GTC 


ATG 




CA'j 


CGG 




A TIC 




ACC 


T Z G GT C 




j G C 




his va 1 






■ 3 ln 


arg 


pro 


thr 


ala 




se: va] 


ala 


jiy 


s e r 


603/201 


















6 3 3/211 






GAT GAC 




AG G 


CAG 




TGT 


* T ' ~" G 




CCT 




CGT 






a p asp 


s e r 




g i n 


o r o 




s •? r 


hi. 5 


arg 


trp cys 


a r g 


G - V 




663/221 
















693/2 i; 








C G C 


ACC 




CGG 


CGG 


T *" 
i J 


TGC 


CGC 


GCA TGG 








gly glu 


arg 


thr 


a rq 


arg 


arg 


ser 


cys 


arg 


ala 









33/11 

jG GAA AAA CAC TTG AAG TCC TTT TTA 
eu lys ser phe leu 

AA CAC GGT GAG GGG 
lu his gly glu gly 

AC CGA AGC CAG CAT 
sp arg ser gin his 

G3 ACC CGC TTC TTC 
:p thr arg phe phe 

2G ACG TCG CTC CGG 
la thr ser leu arg 



arg ala ala gly OPA p r o 

TCA GGT CAC CGT TGG 

ser ala his arg trp 

■jG/v CGA CCA CAG AGT 

gly arg pro gin ser 

GCC G.AC GAC GTG AGG 



VTG TCA GCA TGT GCA 

net ser ala cys a. a 

jAG GAC -CTT GGG GCT 

i-p asp leu qlv ala 



SEQ ID N ' 13G 



WO 99/09186 



PCT/FR98/0I813 



40/185 



partie cie la sequence nucleotide, que de seq!3A 
1/1 31/11 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AG A GTC GGT CAT CGC CTA AGG 
gly ser phe val thr aid gly leu asp ala asp asp his arg val gly his arg leu arg 
61/21 g 1/31 y 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA GGC ACG TCA TGT CTC AGC 

leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA gly thr ser cys leu ser 

121/41 151/51 

GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG CAG ATG ACT CCA CGC AGC 

gly pro pro pro pro arg ser pro ala val cys gin his vaj gin met *hr pro a-a 3 er 

181/61 211/71 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG CCG CTG GTG *GC OCA CC^ GCC 

241/ef arg lle Vai gly val val val ala thr thr leu ala len val 3Cr aIa P r ° al ' a 

GGC GGT CGT GCC GCG CAT GCG GAT C 
gly gly arg ala ala hi s ala asp 



SEQ ID N° 13A* 



FIGURE 13A' 



1/1 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG 

gly pro leu OPA leu pro gly leu thr arg 
61/21 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC 

tyr arg ser asp leu gly leu arg gly arg 
121/41 

GCC CAC CGC CAC CTC CGT CGC CG 3 CAG TAT 

ala his arq his leu gly arg arg gin tyr 
131/61 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA 

leu phe ala ser leu val sc: trc leu aig 
241/81 

CCG GTC GTG CCG CGC ATG CGC ATC 

ala va 1 val pro arg rr.e t jr: 1 i 



31/11 

ACG ACC AC A GAG TCG CTC ATC GCC TAA GGC 

thr thr thr glu ser vai lie ala OCH gly 
91/31 

CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 

arg arg arg glu ala irg his val ser ala 
151/51 

AG; ATG TCC AG A TGA CTC CAC GCA GCC 

val ser rvt cys arg OTA leu his ala aid 
211/71 

CGA CCT T,rG CGC TGG TGA GCG CAC CCG CCG 

■ 1IC J P- - " -ii) (GV\ ala his pro pre 



SEQ ID N 13H 



WO 99/09186 



PCT/FR98/0I813 



41/185 



sequence Rvl984c predite par Cole et al . (Nature 393:537-544) et contenant 
seql3A* 

1/1 31/11 

atg act cca cgc age ctt gtt cgc ate gtt ggt gtc gtg gtt gcg acg acc ttg gcg ctg 
Met thr pro arg ser leu val arg lie val gly va 1 va 1 val ala thr thr leu ala leu 
61/21 91/31 

gtg age gca ccc gec gge ggt cgt gec gcg cat gcg gat ccg tgt teg gac ate gcg gtc 
val ser ala pro ala glv gly arg ala ala his ala aso pro cys, ser ? S p il^ a 'a va 1 
121/41 151/51 

gtt ttc get cgc gqc acg eat cag get tct ggt ctt gge gar gtc ggt gag gcg ttc gtc 
val phe ala arg gly thr his gin ala ser gly leu gly asp val gly glu ala phe val 
181/61 211/71 

gac teg ctt acc teg caa gtt ggc ggg egg teg att ggg gtc tac gcg gtg aac tac cca 
asp ser leu thr ser gin val gly gly arg ser lie gly val tyr ala val asn tyr p-o 
241/81 271/91 -r^- 

gca age gac gac tac cgc gcg age gcg tea aac ggt — gar. gcg age gec cac a*-.~ 

ala ser asp asp tyr arg ala ser ala ser asn qiy sol aso aso d l a ser ala ^s , i 
301/101 331/ 1 1 1 " ' ^ 

cag cgc acc gtc gee age tgc ccg aac ae:: agg att gtg ctt ggt ggc tat tcq cag ggt 
gin arg thr val ala ser cys pro asn thr arg ile va; leu gly qly tyr s^r q- c ; v 
361/121 291/131 J ^ 

gcg acg gtc ate gat ttg tec acc teg gcg atg ccg ccc gcg gtg gca gat cat gtc gec 
ala thr val ile asp leu ser thr ser ala met pro oro ala val ala asp his val ala 
421/141 45: /■ 151 

get gtc gec ctt ttc qgz gag cca tec agt qgt ttc t r.r age atg ttg tgg ggc ggc gga 
ala val ala leu phe gly glu pro ser ser gly phe se: rr.et Leu tro glv glv al- 

481/161 cii/ivi * 

teg ttg ccg aca ate ggt ccg ctg tat age — a-; acc at a aac ttg tgt get c g-- 
ser leu pre thr lie glv pro leu 
541/181 

gat cca at a tqc acc or 



^ V - ~i - Ll - 1 - u - - 

asp pro iIm cys thr civ cly glv as:: i.l- 
601/201 

atg aca age cag gcg gag aca tt.c gcg ; ; 

rr.et thr ser qln ala ala thr phe ala ala 



v i . 



asn leu cys ala pro 

- -q tat gtt cag 

^: ty: val gin ser 

gec gqa tqa 

h : s ala gly Q PA 



FITtURK 



WO 99/09186 



PCT/FR98/01813 



42/185 



Seql3F: ORF predite 
1/1 

tga ggc acg tea tgt 
OPA gly thr ser cys 
61/21 

gtg cag atg act cca 
val gin met thr pro 
121/41 

gcg ctg gtg age gca 
ala leu val ser ala 
181/61 

gzg gtc gtt ttc gc.r. 
ala val val phe ala 
211/31 

ttc gtc gac teg ctt 
phe val asp ser leu 
301/101 

tac cca gca age gac 
tyr pro ala ser aso 
3 61/121 

cac ate cag cgc acc 
his lie gin arg thr 
421/141 

cag ggt gcg acg gtc 
gin gly ala thr val 
481/161 

gtc gec get gtc gec 
val ala ala val aid 
54 1/18 1 

gac ggg teg ttg ccg 

v * V 5 - V 5 r - u p - o 

6 \ I 2 0 1 

ccc gac gat cca dU 

pro asp a op pro lie 
661/221 

* " c '; -J at; a a a ac ; 



par Cole et al . (N 



etc age ggc cca ccg 
leu ser gly pro pro 

cgc age ctt gtt cqc 
arg ser leu val arg 

ccc gec ggc ggt cgt 
pro ala gly gly arg 

cac aar f\ rn r.it- r-xn 
arg gly thr his gin 

acc teg caa gtt ggc 
thr ser gin val gly 

gac tac cgc gcg age 
asp tyr arg ala ser 

gtc gec age tgc ccg 
val ala ser cys pro 

ate gat ttg tec acc 
lie asp leu ser thr 

ctt ttc ggc gag cca 
leu phe gly gl u pro 

aca ate ggt ccg ctg 

tajc acc gga ggc ggc 
cys thr gly yly gly 



ture 393:537-544) et 
31/11 

cca cct egg teg ccg 
pro pro arg ser pro 
91/31 

ate gtt ggt gtc gtg 
ile val gly val val 
351/51 

gec gcg cat gcg gat 
ala ala his a. la asp 
211/71 

rtr-t- t-^t- 

v . w y y 

ala ser gly leu gly 
271/91 

ggg egg teg att ggg 

gly arg ser lie gly 
331/111 

gcg tea aac ggt tec 

ala ser a s n gly ser 
391/131 

aac ace agg att gtg 

asn thr arg ile val 
451/151 

teg gcg atg ccg ccc 

ser ala met. pro Dro 
511/171 

tec agt ggt ttc tec 

ser ser gly phe ser 
57 1/191 

tat age Let d ; ig ac: 

tyr ser ser lyo th: 
631/211 

aat att atg gcg cat 

a s ile met a 1 a h i s 

091/231 

a : s a : i • :. a : j 1 - 



contenant Rvl984c 



gca gta tgt cag cat 
ala val cys gin his 

gtr gcg acg ace ttg 
val ala thr thr leu 

ccg tgt teg gac ate 
pro cys ser asp ile 

gac gt^ yyi gay gcg 
asp val gly gl u ala 

gtc tac gcg gtg aac 
val tyr ala val asn 

gat gat gcg age gec 
asp asp ala ser ala 

ctt ggt ggc tat teg 
leu gly qly m t^r ser 

gcg gtg gca gat cat 
ala val ala asp his 

age atg ttg tgg ggc 
ser met leu t rp gly 

ata aac ttg tat act 
asn lea cvs ala 




SKQ 113 N' J 13F 



WO 99/09186 



PCT/FR98/01813 



43/185 



CCA CCG GGG CTG GAG GGG CGA 
pro pro gly leu glu gly arg 
61/21 

GCG GCT GAT CCC CTG GCC CGA 
ala ala asp pro leu ala arg 
121/41 

GTA GCG GTT CGG CGG GAA CCG 
val ala val arg arg glu pro 
181/61 

GAC GGG TAT GGC GGC GAC TGA 
asp gly tyr gly gly asp OPA 
241/81 

TTA CGA CCA GGr T A AT TTC GAA 
leu arg pro gly asn phe glu 
301/101 

AC Z CCC TAG GTG TAG TGT TTT 
thr pro AMB val AYB cys phe 

C 



31/11 

ATG TGC GCC GAA CGC CGT CGG 
met cys ala glu arg arg arg 
91/31 

GAC GGG GCA AGC CAA TAG CGG 
asp gly ala ser gin AMB arg 
151/51 

AGC GCC GAC GTT GTC GGT GCC 
ser ala asp val val gly ala 
211/71 

GGT GAT CTG CGA CAC GCC GCC 
gly asp leu arg his ala ala 
271/91 

HIT fZT'V AT^ 1 r~*.r* * », r- Tim,- m-n,-. 
- > * ' w^ivj iui^» Ai ^. * 

asn val lie gin asn lie leu 
331/111 

CGA GTA CCG GCA GAT CCC AGT 
arg val pro ala asp pro 



SEQ ID N° 14A 
FIGURE 14A 



CCA ACT TGG CCG CTG AGG 
pro thr trp pro leu arg 

CTC CAT CGG GCT TTG CTG 
leu his arg ala leu leu 

CGG TGA TAT ATT GGG TCA 
arg OPA Lyr ile gly ser 

GCG GTG CTC GAG CCA GGC 
ala val leu glu pro gly 

TAT CTC TTC CTC Lbi bCC 
tyr leu phe leu arg did 

TCA CCA GTC TCA CCA GAT 
s^r pro val ser pro asp 



CAC CGG GGC TGG AGG GGC GAA TGT GCG CCG AAC GCC GC C GCC CAA CTT GGC CGC TCA GGG 

his arg gly trp arg gly glu cys ala pro asn ala val gly gin leu gly arg OPA qly 
0 ~ ' 1 1 92/31 

CGG CTG ATC CCC TGG CCC GAG ACG GGG CAA GCC AAC AGC GCC TCC A~C GGG r-» — 

arg leu il- p;:j trp prn glu rhr gly :;ln ala a:;n r.r-r gly s-r i ' * qly ■ * 

122/ 41 ■ ~~ ' ' • 



WO 99/09186 



PCT/FR98/0I813 



44/185 



ACC GGG GCT GGA GGG GCG 
thr gly ala gly gly ala 
63/21 

GGC TGA TCC CCT GGC CCG 
gly OPA ser pro gly pro 
123/41 

AGC GGT TCG GCG GGA ACC 
ser gly ser ala gly thr 
183/61 

CGG GTA TGG CGG CGA CTG 
arg val trp arg arg leu 
243/81 

ACG ACC AGG GAA TTT CGA 
thr thr arg glu phe arg 
3 03/101 

CCC CTA GGT GTA GTG TTT 
pro leu gly val val phe 



33/11 

AAT GTG CGG CGA ACG CCG TCG 
asn val arg arg thr pro ser 
93/31 

AGA CGG GGC AAG CCA ATA GCG 
arg arg gly lys pro ile ala 
153/51 

GAG CGC CGA CGT TGT CGG TGC 
glu arg arg arg cys arg cys 
213/71 

AGG TGA TCT GCG ACA CGC CGC 
arg OPA set ala thr arg arg 
273/91 

AAA TGT TAT TCA GAA CAT CTT 
lys cys tyr ser glu his leu 
333/111 

TCG AGT ACC GGC AGA TCC L'AG 
ser ser thr gly dig .ser c; ]. r. 



GCC AAC TTG GCC GCT GAG GGC 
ala asn leu ala ala glu gly 

GCT CCA TCG GGC TTT GCT GGT 
ala pro ser gly phe ala gly 

CCG GTG ATA TAT TGG GTC AGA 
pro val ile tyr trp val arg 

CCC CGT GCT CGA GCC AGG CTT 
arg gly ala arg ala arg leu 

GTA TCT CTT CCT CCG TGC CAC 
val ser leu pro nrn n/c his 

TTC ACC ACT CTC ACC AGA TC 
phe thr ser leu thr arg 



SEQ ID N° 14C 



FIGURE 14C 



partie de la sequence r.ucl eotidiqu e d 



e s e ; 



31/11 

TTT TCG AGT ACC GGC AGA TCC CAG GTT CA: ;.A., ,;c 
phe ser ser thr gly arg ser gin val his -;!:. v 



SEQ ID N J 14.V 



FIGURE I4A* 



SEQ ID N 



WO 99/09186 



PCT/FR98/01813 



45/185 



ORF predite d'apres la sequence publiee par Cole et al . (Nature 393:537-544) e t 
rnnf.pnsnt ^ f» n 1 4 A 1 



contenant seql4A* 
!/l 31/11 



IAG LGG 


TTC 


GGC 


GGG 


AAG 


CTA 


GCG 


GCG 


ACG 


TTG TCG 


GTG 


GCC 


GGT 


GAT 


AMB arg 


phe 


gly 


gly 


lys 


leu 


ala 


ala 


thr 


leu ser 


val 


ala 


gly 


asp 


61/21 


















91/31 






ACG GGT 


ATG 


GCG 


GCG 


GCT 


GAG 


GTG 


ATC 


TGC 


GAC ACG 


CCG 


CCG 


CCG 


TGC 


thr gly 


met 


a la 


ala 


ala 


glu 


val 


ile 


cys 


a^p thr 


pro 


pro 


a rg 


cys 


121/41 


















151/51 






TAC GAC 


CAG 


GGA 


ATT 




AAA 


ATG 


TTA 


TTC 


AG A AC A 


TCT 


TGT 


ATC 


TCT 


t.yr asp 


gin 


gly 


ile 


ser 


lys 


met 


leu 


phe 


arg thr 


s e r 


cys 


ile 


ser 


181/6]/ 


















9 1 1 / 7 1 






CCC CTA 


GGT 


GTA 


GTG 


TTT 


TCG 


ACT 


ACC 


GGC 


AG A TCC 


CAG 


GTT 


CAC 


CAG 


pro leu 


gly 


val 


val 


phe 


ser 


ser 


thr 


gly 


arg se r 


y L 1 1 


val 


h i s. 


gin 


2 4 1/81 


















2 7 1/91 








cca egg 


ggc 


g^g 


atg 


aac 


ttc 


ccg 


gca 


teg 


g c a tc g 


C C Li 


ggt 


cga 


egg 


pro arg 


gly 


ala 


met 


as n 


phe 


pro 


a ] a 


ser 


ala ser 


pro 


gly 


arg 


a rg 


301/101 


















331/11 1 




tat gac 


ggg 


aa t 


ctg 


gag 


cct 


tgt 


egg 


qcc 


get caa 




ate 


ga a 


gat 


tyr asp 


gly 


a sr. 


leu 


glu 


pro 


c y s 


arg 


ala 


ala q 1 r. 


h i .-, 


i 1 e 


g 1 u 


asp 


361/121 


















3 91/13 1 








teg ttg 


cca 


gat 


cct 


gtc 


agd 


t L c 


ccg 


at t 


tec gca 


aag 


gag 


egg 


tac 


ser leu 


p ro 


asp 


pro 


val 


arg 


phe 


pro 


ile 


-st>r ala 




glu 


arg. 


tyr 


421/141 






















gac cgt 


tta 


cac 


taa 






















asp arg 


\ eu 


h i s 


OCH 























TCG AGC CAG GCT 



- - ^ " - v-^ , 

- 5 a s d arc 



SEQ ID N ; 14F 
FIGURE 14 F 



WO 99/09186 



PCT/FR98/01813 



46/185 



Sequence Rv3054c predite par Cole et 1. (Nature 393:537-544) 
pouvant etre en phase avec Seql4A T 



1/1 

gtg tea 
val ser 
61/21 
teg ttc 
ser phe 
121/41 
acc atg 
thr met 
161/61 
gag gtg 
glu val 
241/31 
gtg gtc 
val val 
301/101 
ctg tec 
leu ser 
361/121 
tec atg 
ser met 
421/141 
get ggc 
a 1 a g 1 y 
401/161 
teg gtc 
ser val 
5 4 1/181 
get gag 
did gld 



gat acc 
asp thr 

aac cgc 
asn arg 

ttc gag 
phe glu 

ccg gcg 
pro ala 

acg ccg 
thr pro 

agg cca 
arg pro 

ggc cgc 
gly arg 

acg egg 
thr arg 

gcg gac 
ala asp 

gtc gc 



aag tec 
lys ser 

cag ate 
gin ile 

ggg ctg 
gly leu 

ccg gtg 
pro val 

gaa tac 
glu tyr 

ttc ggc 
phe gly 

^:ac ggc 
:yr gly 

gtg gtc 
va 1 va 1 

gac gec 
asp ala 

tga 
OP A 



gac 
asp 

gee 
ala 

ggg 

gly 

age 
ser 

aac 
asn 

gat 
asp 

ggg 

gly 

gat 
asp 

ggg 
gly 



ate 
lie 

gag 
glu 

ga c 
asp 

gcg 
ala 

ggc 
gly 

ggc 
gly 

gta 
va 1 

gcg 
ala 

ctg 
leu 



aaa 
lys 

ctg 
leu 

ctg 
leu 

ttg 
leu 

age 
ser 

gcg 
ala 

tgg 
trp 

ate 
lie 

gcg 
ala 



ate 
ile 

get 
ala 

ccg 
pro 

egg 
arg 

att 
ile 

ttg 
leu 

gcg 
ala 

aaa 

ivs 



s><-y 
aid 



31/11 
ttg gec 
leu ala 
91/31 
gec aag 
ala lys 
151/51 
ttc tac 
phe tyr 
211/71 
gag gec 
glu ala 
271/91 
ccg gec 
pro ala 
331/111 
aag gac 
lys asp 
391/131 
cae gac 
his asp 
451/151 
ctg teg 
leu ser 
511/171 
aat gtg 
asn val 



tta gtg 
leu val 

gtc get 
val ala 

aac gaa 
asn glu 

gcg tct 
ala ser 

gtg ate 
val ile 

aag ccg 
lys pro 

gag act 
glu thr 

gtg ccg 
val pro 

cgc gac 
a r g a s p 



gga age 
gly ser 

ccg gac 
pro asp 

gac ate 
asp ile 

gac gcg 
asp ala 

aag aac 
lys asn 

ttg gec 
leu ala 

cgc aag 
arg lys 

ttc caa 
phe gin 

gec gtc 
ala va 1 



ctg cgc gcg gcg 
leu arg ala ala 

ggc gtc acc gtc 
gly val thr val 

gac aca gcg acg 
asp thr ala thr 

cac get gee ttg 
his ala ala leu 

0 

gcg ate gac tgg 
ala ile asp trp 

gtg ate ggc ggc 
val lie gly gly 

teg ttc age ate 
ser phfiSfer ile 

act ctg ggc aag 
thr leu gly lys 

ggc aac ttg gc:c 
gly asn leu ala 



SEQ ID N° 14R 



WO 99/09186 



PCT/FR98/01813 



47/185 



ORF predite par Cole et al. 
1/1 

taa cgc gat egg aat aaa teg 
OCH arg asp arg asn lys ser 
61/21 

caa gcg gaa agg aac gta gca 
gin ala glu arg asn val ala 
121/41 

gtg gga age ctg cgc gcg gcg 
val gly ser leu arg ala ala 
181/61 

get ccg gac age ate are ntr 
ala pro asp gly val thr val 
241/81 

gaa gac ate gac aca gcg acg 
glu asp ile asp thr ala thr 
301/101 

tct gac gcg cac get gee ttg 
scr asp ala his ala ala leu 
361/121 

ate aag aac gcg ate gac tgg 
lie lys asn ala ile asp trp 
421/141 

ccg ttg gec gtg ate ggc ggc 
pro leu ala val ile gly gly 
481/161 

act cgc aag teg ttc age ate 
thr arg lys ser p h e ser : 1 ^ 
541/181 

ccg ttc caa act ctg ggc aag 
pro phe gin thr leu gly lys 

60:/? oi 

gac gec qte ggc: anr ttg ge? 
asp ala val gly asn leu ala 



(Nature 393:537-544) et 
31/11 

gac cat ggt ccg gtt ggc 
asp his gly pro val gly 
91/31 

gtg tea gat ace aag tec 
val ser asp thr lys ser 
151/51 

teg ttc aac cgc eag ate 
ser phe asn arg gin ile 
211/71 

p\ rc* nrn rr ~ ^ 

thr met phe glu gly leu 
271/91 

gag gtg ccg gcg ccg gtg 
glu val pro ala pro val 

331/111 
gtg gtc acg ccg gaa tar 
val val thr prD glu tyr 

391/131 
ctg tee agg cea ttc ggc 
leu ser arg pro phe gly 

451/151 
tec atg ggc cgc cac ggc 
ser met gly arg tyr gly 

511/171 
get ggc acg egg gtg gtc 
ala gly thr arg val va 1 

57 1/191 
teg gtc gcg ga - gjc g. •- 
ser val ala asp asp ala 

631/211 
get gag gtc: gg- tgj 
a Id g ] u va 1 gly OP A 



contenant Rv3054c 



teg tgc aag gac gtg gac caa 
ser cys lys asp val asp gin 

gac ate aaa ate ttg gec tta 
asp ile lys ile leu ala leu 

gec gag ctg get gee aag gtc 
ala glu leu ala ala lys val 

ggg gac etg ccg tic Lac aac: 
gly asp leu pro phe tyr asn 

age gcg ttg egg gag gee gcg 
ser ala leu arg glu ala ala 

aac ggc age att ccg gee gtg 
asn gly ser ile pro ala val 

gat ggc gcg ttg aag gac aag 
asp gly ala leu lys asp lys 

ggg gta tgg gcg cac qac gag 
gly val trp ala his asp glu 

?at gcg ate aaa ctg teg gtg 
asp ala ile lys leu ser val 

ggg ctg gcg gcg aat gtg cgc 
g I y \ e u a la a 1 a a s n va 1 a r g 



SEQ ID N 14; 



WO 99/09186 



PCT/FR98/01813 



40/185 



fragment d'apres la sequence publiee pat Cole et al. 
seq 14F' et seq 14P* 



(Nature 393:537-544) et contenant 



I'l 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tgc aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly 3er cys lys asp val asp gin 
asn ala lie gly ile asn arg chr met val arg leu ala arg ala arg thr trp thr asn 
thr arg ser glu OCH He gly pro trp ser gly trp leu val gin gly arg gly pro thr 
61/21 9 1/31 

caa gcg gaa agg aac gta gca gtg tea gat acc aag tec gac ate aaa ate t t-g gec tt* 
gin ala glu arg asn val ala val ser asp thr lys ser asp ile lys He leu ala leu 
lys arg lys gly thr AMB gin cys gin lie pro ser pro thr 3 er lys 3 * r rrp pro ANB 
ser gly lys glu arg ser ser val arg lyr gin val arg his gin asn leu gly leu ser 
121/41 151/51 

gtg gga age ctg cgc gcg gcg leg ttc aac cgc cag ate gec gag ctg get gec aag qtc 
val gly ser leu arg ala ala ser phe asn arg qln He ala glu leu ala ala lys val 

- - - j ; j — ^« pro ser trp leu pro arg ser 

gly lys pro ala arg gly val val gin pro pro asp arg arg ala gly cys gin gly arc 
1 a 1 / 6 1 211/71 

get ccg gac ggc gtc acc gtc ace atg ttc gag ggg ctg jqg gac ctg ceg tte tac aae 
ala pro asp gly val thr val thr met phe glu gly leu 3 . Ly asp leu pro phe t-r asn 
leu arg thr ala ser pro ser pro cys ser arg gly trp gly thr cys arg ser thr thr 

.,wa, gly h15 VcU arCJ gly ala giy 9ly P ro < lla ^1 leu gin arg 

241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gec qcq 
glu asp ile asp thr ala thr qlu val pro ala pro val .ser ala leu arg glu ala ala 
lys thr ser thr gin arg arg arg cys arg arg arg OPA ala arg cys gly arg pro arg 

™w?^ 13 arg h13 3er a3p gly gly ala gly dld gLy glu ar ? vaL Ai * giy giy arg va i 

301/101 331/111 ^ 

tct gac gcg cac get gec ttg gtg gtc acg ccg gaa tac aac ggc age act ccg gee gtq 
ser asp ala his ala ala leu val val thr pro glu tyr a 3 n glv 3 er He pro ala va? 
leu thr arg thr leu pro trp trp ser arg arg asp. thr thr a. a ala phe arg pro OPA 
* rg ala arg Cys leu qly his ala gly He ,1. arg gin his ser gly arg asn 

j.61/121 39:7ii; 
ate aag aac gcg ate gac tgg ctg tec agg cca ttc qqg gat ggc c 
ile lys asn ala ile asp trp leu ser arg pro ph^ rj 
ser arg thr arg ser thr gly cys pro gly his ser 
qln glu arg asp a:y leu ala val gin ala ile ar 
4 2 1/14 1 451/1 Si 

ccg ttg gec gtg ate ggc ggc tec atg ggc cgc "a? 
pro leu ala val lie gly gly ser met gly arg tyr 
arq trp pro CPA ser ala ala pro trp ala ala thr 
va 1 gly arc; asp arc; 



sp gly 
rtla r.et a 1 f 
' irg tr-o a: 



g..y ■. 
1 h 1 y 



g ttg aag gac aag 
ala leu ly 3 asp lys 

arc; 0 PA arg thr ser 
7 val glu gly gin ala 



131/161 

i ::: t cgc aag 

hr arg lys 

1-jg ala 



arg ;C' 

.eg 1 1 c; a q z ate < 
~ n r pho so r : 1 e 
i r g ala 



;cg cac gac gag 
1 1 a he s asp glu 
arg thr thr arc: 
i al i :.r: a::: a- 



acg egg 
thr arg 

n a: g gl . 

is ala g 1 



ct.g teg gtg 



In t h r leu gly I y ;j val ;t i d d: - ? 



arg ^?r lys ..-u trp a 



g,: ; g* : 



-V * ■ ■■' ' : i - 1 a ^ a a s:i va 1 arc 



i Vrh./V^Vf N I \ k I G t 



WO 99/09186 



PCT/FR98/01813 



49/185 

721/241 751/251 

egg egg ccg gtg ata tat tgg gtc aga egg gta tgg egg egg ctg agg tga tct gcg aca 
arg trp pro val lie tyr trp val arg arg val trp arg arg leu arg OPA aer ala thr 
gly gly arg OPA tyr lie gly ser asp gly tyr gly gly gl y OPA gly asp leu arg his 
val ala gly asp lie leu gly gin thr gly met ala ala ala glu val ile cys asp thr 
781/261 811/271 

cgc cgc cgc ggt get cga gec agg ctt acg acc agg gaa ttt cga aaa tgt tat tea gaa 
arg arg arg gly ala arg ala arg leu thr thr arg glu phe arg lys cys tyr ser glu 
ala ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn 

a^^o? CO Cy3 gln ala Cyr a3p gin lie 3er ™>t phe arg thr 

8 4 l/2ei 871/251 

eat ctt gta tct ctt etc cgt gec acc ccc tag gtg tag tqt ttt cga gta ccg gca gat 
his leu val ser leu leu arg ala thi pio AMB val AKH cys phe arg val pro ala asp 
He leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile 
ser cys ile ser ser pro cys his pro leu gly val val phe ser ser thr gly arg ser 
901/301 931/311 

ccc agg ttc acc agg tct cac cag ate cac ggg gcg cga tga act tec caa cat ran ™t- 
P lu arg phe rhr arg ser his gin lie his gly ala arg OPA thr ser arg his arg his 
pro gly ser pro gly leu thr arg ser thr gly arg asp glu leu pro gly ile gly ile 

n.w^Y* 1 9ln Wl 5er Pr ° aSp Pr ° arg gly ala mot d3 " P he ala ser ala ser 

961/321 991/331 

cgc cag gtc gac gga cgt ggt cgc get atg acg gga ate Ujq age ctt gtc ggg ccg etc 
arg gin val asp gly arg gly arg ala met thr gly He trp ser leu val gly pro leu 
ala arg ser thr asp val val ala leu OPA arg glu ser gly ala Ipu ser gly arg se- 
pro gly arg arg thr trp .ser arg tyr asp gly asn leu glu pro cy, arg ala ala glr. 
1021/341 1051/351 

aac ata teg aag atg cac tac ttg agt cgt tgc cag ate ctg tea gat tec cga ttt ccq 
asn lie ser lys met his tyr leu ser arg cys gin lie leu ser asn ser arg phe pro 
thr tyr arg arg cys thr thr OPA val val ala arg ser cys gin ile pro asp phe arq 

,now^T e lGU l6U giU 3er leU Pr ° d3p pro val arc ? phe Dro ile ser al'a v 

1081/361 1111/371 

caa agg age ggt acg ccc atg acc gtg acc gtt tac act aa 

gin arg ser gly thr pro net thr val thr val tyr thr 

lys gly ala val arg pro OPA pro OPA pro phe thr leu 

lys glu arg tyr ala his asp arg asp arg leu his OCH 



SEQ ID N 3 14Q(suite) 
FIGURE 14Q(suite) 

] ^ 3: :; 



. AC fv.'rN r i wi 



WO 99/09186 



PCT/FR98/0I813 



50/185 



AAG CCC GGC CGC GAG TGT 
lys pro gly arg asp cys 
62/21 

CGC ACC ATG GTG TGC ACC 
arg thr met val cys thr 
122/41 

GAT GCC CGC GCC CCG GCG 
asp ala arg ala pro ala 
182/61 

GCG GAC CAG TCG GCG ATG 
ala asp gin ser ala ir.et 
242/81 

TCT GAG GTG GCG AAG ACC 
ser glu val ala lys thr 



32/11 

TTG CCG TTT TGG GGC TCC TAC 
leu pro phe trp gly ser tyr 
92/31 

AGT TGC GAT CGG TTC CTC CCG 
ser cys asp arg phe leu pro 
152/51 

GCG CAG CTG CGT AGC TCG ACC 
ala gin leu arg ser sc: thr 
212/71 

TCG AGG CGA TGG CAA TAC AGC 
ser arg arg trp gin tyr ser 
272/91 

AGT CCC GCG CCC ACC GGC AGC 
ser pro ala pro thr gly ser 



SEQ ID N° 15B 
FIGURE 15B 



CAG AAC ACC ACC TGG CGG CCG 
gin asn thr thr trp arg pro 

CGC GCG GGC GGC GAC GAC GTC 
arg ala gly gly asp asp val 

CGG TCG ACG ACG ACG GGC TCG 
arg ser thr thr thr gly ser 

GCC TTG GTG CGC GGC CAC ACG 
ala leu val arg gly his thr 

CGG ATC CGG ATA CGC GGT AC 
arg ile arg ;le arg gly 



3 3/11 

AGC CCG GCC GCG ACT GTT TGC CGT TTT GGG GCT CCT ACC AGA AC A CCA CCT GGC GGC CGC 

ser pro a, a ala thr val cys arg phe gly ala pro tn: thr pr, pro g l y gly ar - T 

D 9 3/31 

GCA CCA TGG TGT GCA CCA GTT GCC ATC GGT TCC TCC CCC CCC CGG GCC GCC ACG *CG — 

al3 ?f 0 trp val d - G^y ser ser nra al.i a— ala ala thr -h" s- 



r * r 

" ~" "'" ~'~ d -'~f ^-i:g C 1 v a: 



^ 213/71 



SEQ ID N ' ITiC 



WO 99/09186 



PCT7FR98/01813 



51/185 



oartie de la sequence nucl eo t j.di que cie seq l 5 A 



1/1 
















31/U 








GGC GGC 


CGC 


GCG 


CCA 


TGG 


TGT 


GCA CCA 


GTT 


GCG ATC 


GGT 


TCT 


CCC 


gly gly 


a rg 


ala 


pro 


trp 


cys 


ala pro 


va 1 


ala lie 


gly 


ser 


p ro 


61/21 
















91/31 




CGA CGT 


CGA 


TGG 


CCG 


CGC 


CCC 


GGC GGC 


TGC 


AGC TGC 


GTA 


GCT 


CGA 


arg arg 


a rg 


trp 


pro 


arg 


pro 


gly gly 


cys 


s e r c y s 


va 1 


ala 


a rg 


121/41 
















151/51 






CGG GGT 


CGG 


CGG 


GCC 


AGT 


CGG 


CGA TGT 


CGA 


GGC GAT 




AAT 


AC A 


arg gly 


a rg 


arg 


aia 


cer 


arg 


arg cys 


arg 


r-v 




a s n 


t; h r 


181/61 














.Mi/7: 








GCC AC A 


CGT 


CTG 


AGG 


TGG 


CGA 


AGA CCA 


GTC 




CCA 


CCG 


GCA 


a 1 a t h r 


arg 


leu 


dig 


L r p 


arg 


arg pre 


va i 


p r ■:, a :; 


p r o 


pro 


ala 



GA TC 



SEQ ID N L: 15A' 
FIGURE 15A' 



GCG GCC GCG CGC CAT GGT GTG CAC CA3 TTG CGA TC;; GTT CTC CCG CGC GCG GGC GGC GV 
ala ala ala arg his gly val his glr. le- .?. r j 3.- va 1 1 nro ar- 



61/21 , t Ml " * ala gly gi * as P 

GAC GTC GAT GGC CGC GCC CCG GCG GCT GCA GCT^CC TAG CTG GAG CCG GTC G/- G G- 

121/lf '" 5? ' 3ly ai<3 Pr ° " la ■;r i /" 1 A ' 3 lf - : val asp asp asp 

gly val gly gly pro va] glv aso val -1- .. 1 : - > ' •> . 
1 R 1 / 6 1 



:t GGT g:;g GGG 



SEJ ID N' 1 5B ' 
rlGUKr; 1 hH ' 



WO 99/09186 



PCT/FR98/018I3 



52/185 



ORF contenant SeqlSA 1 d'apres Cole ec a 
1/1 

taa ggt ccg cca acg ctt tac get cga egg 
OCH gly pro pro thr leu tyr ala arg arg 
61/21 

cgt agt cgc cgc agg gca ggg ctt ccc gcg 
arg ser arg arg arg ala gly leu pro ala 
121/41 

agg ggt age gtt cgt ggg cgt cga cga cga 
arg gly ser val arg gly arg arg arg arg 
181/61 

egg tgg ggg tgc gca cqc ccq gec ccg act 
arg trp gly cys ala arg nro ala ala thr 
241/81 

cca cct ggs ggc cgc acq cca tgg tgt gca 
pro pro gly gly arg ala pro tro cys ala 
301/101 

cjg cga cga cgt. cga tgg ccg eg z ccc ggc 
arg arg arg arg arg tip pro arg cro gly 
361/121 

cga cga egg ggt egg egg gec agt egg cga 
arg arg arg gly arg arg ala ser arg arg 
421/141 

tgc gcg gec a-:a cgt ctg agg tgg cga aga 
cys ala ala thr arg leu arq tr;; arg arc 
4 81/161 

ggt agg gca ggc gcg agt ctt cac egg cgt 
gly arg ala gly ala ser leu gin arg a 1 y 
541/181 

agg gca eg g gcg g c g t a c g g c a a c g g t g a -> 
arg val arg ala ala tyr' qiv a sr. gly elu 
631/2 0: 




1 . (Nature 393:537-544) 
31/11 

ccg cca cga gtt ggc egg cca ctt tea ggc 

pro pro arg val gly arg pro leu ser gly 
91/31 

teg tct teg egg gtt. tgt egg eaa agg tgt 

ser ser scr arg val cys arg gin arg cys 
151/51 

tgt gca get egg gga tgc egg egg cgc ggg 

cys ala ala arg gly cys arg arg arg gly 

2i; m 

g !~ ■ *~ g c gcg 1 1 1 tgg ggc tct ljll a g , i a c a 

val cys ala phe trp gly ser ala arg thr 

71 1 ■' 3 1 

c:a '^ t:L 9 ::i 7 a - c -ct ccc gcg cgc ggg 

pr:a val ala :M gly ser pro ala arg gly 
3 3 !. ■ 1 1 1 

ggs- tgc aa: tgc gta get cga ccc ggt cga 

Qiy cys so r cys val ala arg pro gly arg 

3 91.13 1 

tgt cga ggs gat ggc aat aca gcg cct tgg 

cys arg gly asp gly asn thr ala nro rrp 

4 5 1 / 1 5 1 

cca gtc ccg cgc cca ccg gca gec gga tea 

l' : - :> '-'al pre arg pre pro ala ala alv ser 
Ml, 171 

tgg ;;gg c'n cga gca get cca cag agt gtg 

t:: arg i : arc ala ala pro gla se: val 

' ; ' ' : }. " - 1 "- -eg a;-g aac co teg tci cgt 



WO 99/09186 



PCT/FR98/01813 



53/185 



R:Rv2530c predite 
phase avec SEQ15A 
1/1 

gtg acg gca ctg etc 
val thr ala leu leu 
61/21 

cat gcg gec gcg cag 
his ala ala ala gin 
121/41 

ate acc gag gca ggg 
lie thr glu ala gly 
181/61 

acg ccg get ate gcg 
thr pro ala ile ala 
241/81 

tgg cct gec gat gtg 
trp pro asp asp val 
301/101 

cgt egg gtc acc gar' tgc cat etc ate 
his arg arg val thr asp cvs his leu ile 
361/121 

gtc aca ttc gat 



d'apres Cole et al. (Nature 393 : 537-544 ) ot pouvant etre er 



gat 
asp 

cga 
a rg 

tat 
tyr 

ate 
ile 



gtc 
val 

tgg 
trp 

gtc 
val 

get 
ala 



c ^ a l. iy 
pro leu 



aat gtg 
a s n val 

ttc acg 
phe thr 

cga att 
arg ile 

cag ttq 
gin leu 

auc gtt 
ile val 



ctg 
leu 

cag 
gin 

tea 
se: 

gcg 
ala 

ggg 

gly 



gec gca ctg 



il thr phe asp ala ala 



qcc gat 
ala asp 



tea 



31/11 
ate gcg 
ile ala 
91/31 
ttc tec 
phe ser 
151/51 
age aat 
ser a .s n 
211/71 
gcg atg 
ala met 
271/91 
age gec 
ser ala 
331/111 
gee ttg 
ala leu 
391/131 
gca tee 
ala s e i 



ctg ggc 
leu gly 

teg aat 
ser asn 

cgc agt 
arc ser 

act tct 
thr ser 

ggc gat 
gly asp 

gec gcq 
ala ala 

gca ggc; 
ala gly 



tgg ccg aat 
trp pro asn 

ggg tgg gec 
gly trp ala 

gtg atg cag 
val rr.et gin 

ctt gec ggg 
leu ala gly 

cgc gat gcg 
arg asp ala 

cgc tac ggg 
arg tyr gly 

etc gtc gag 
leu val :j]u 



cac gtt cac 
his val his 

acc acg ccg 
thr thr pro 

gtg teg ace 
val ser thr 

cac acg ttt 
his thr phe 

gtq tec aac 
val set asn 

ggc egg rtg 
gly arg leu 

gtg ttg tag 
val leu a:<:b 



SEQ ID N° 15R 



FIGURE 15R 



WO 99/09186 



PCT/FR98/01813 



54/185 



Fragment contenant SeqlSP' et Seq lbF' 
1/1 31/11 

tga tgt tec gec gga tgc gec gac ggt gac ttc cga gga tgt cgt ccg cgc get cga gga 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
asp val pro pro asp ala pro thr val thr ser glu asp val val arg ala leu glu asp 
Met phe arg arg met arg arg arg OPA leu pro arg met ser ser ala arg ser arq thr 
61/21 91 / 31 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg age tgg ccg a-t cac 
arg arg val thr ala leu leu asp val asn val leu lie ala leu gly trp pro asn his 
asp val OPA arg his cys ser met ser met cys OPA ser. arg trp ala gly arg He thr 
chr cys asp gly thr ala arg cys gin cys ala asp arg ala gly leu ala glu ser arq 
1-1/41 lbl/51 

gtt cac cat gcg gec geg cag cga tgg ttc acg cag tic tec teg aat ggg tgg gec ace 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 

phe thr met aro n ro n m «^ r * ^r, r**\ lf ^ t: . - . 

- * - -c- - — -^-^ iJi-u ctLLj i;niL giy giy pro pro 

ser pro cys gly arg ala ala met val his ala val leu leu glu trp val gly his has 
161/61 211/71 

acg ceg ate aee gag gca ggg tat gtc cga att tea age aat cgc agt yty atg cag gtg 
thr pro i.e thr glu ala gly tyr val arg lie ser ser asn arg ser val n-t val 
arg arg ser pro arg gin gly r.ot ser glu phe gin ala ile ala val CPA cys arg cys 
ala asp his arg gly arg val cys pro asn phe ly 3 g l n ser qln cys asp ala qly val 
241/81 271/91 

teg ace acg ccg get ate gcg ate get cag ttg geg gcg atg act tct ctt gee ggg cac 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
arg pro arg arg leu ser arg ser leu ser trp arg arg OPA leu leu leu pro gly thr 
asp his ala gly tyr arg asp arg ser val gly gly asp asp phe ser cys arg ala his 
301/101 3J1/1U 

acg ttt tgg ect gac gat gtg cca ctg ate gtt ggg age gee ggc gat cgc gat gcg gtg 
thr phe trp pro asp asp val pro leu He val gly ser ala gly asp arg asp ala val 
arg phe gly leu thr met cys his OPA ser leu gly ala pro ala He ala met arg cys 
ya: leu aM nPA arg cys ala thr asp arg trp glu arg arg arg ser arg cys gly val 
3.1/^21 391/131 



aae cac rqt egg gtc acc gac tgc cat etc ate gee ttg qcc gee eg 



:ac ggg ggc 



scr asn his arg arg val thr asp cys his leu ne a. a ipu aia ala aq tyr gly gi 



•ro thr thr val gi 
aln d r o :r:, ier a 



;er pro trp pro arg ala thr gly a} a 



- arg aia ieu arg gly pro 

4,i/1h. .;si/is: 

c::g ttg gtc aia tie qat c;ac cjea ctg r t r~ gat tea gca tee qea gee r^c gtc qag gtg 

arg leu val tnr phe arjp a- a ala leu ala asp 3 er ala se: aid giy lea val glu val 
,lv trp so: 5er ir^t. pro his trp pro ile gin his P ro gin ala ser s^r a-q cys 



■i : g a : 



' < * ; g-i' -* : -•: a • : i acq : 

7 91 v ieu .a 1-a .: ; a ; -i ala Ha ra. ■ 



a i a p: z a i ,i a 1 ■ 



WO 99/09186 



PCT/FR98/01813 



55/185 



661/221 691/231 

ggt gag ggc ggc ggc tag ata gcg gta ggt gta ttc ccg ggc gag ctl gcg ggt ctg gca 
gly glu gly gly gly AMB lie ala val gly val phe leu gly glu leu ala gly leu ala 

val arg ala ala ala arg AMB arg AMB val tyr 3 er tip ala 5 er leu arg val crp gin 
OPA gly arg arg leu asp ser gly arg cys Ue pro gly arg ala cys qly phe gly arg 
721/^41 751/251 ' ^ 

gaa cac gat egg cac gtt ggg aaa gec gat ctg caa ttc ggc cag ccc ate ggc gat cgc 
glu his asp arg hi a val gly ly 3 ala a 3 p leu gin phe gly gin pro lie gly asp arg 

asn thr lie gly thr leu gly ly 3 pro He cys a 3 n sor ala ser pro 3er ala ile ala 

.,w' r ,f r9 trP qlU 36r arg 3er ala P ro hl * arg arg 3 er pro 

761//61 811/271 * 

cgt egg gcg ggc gaa gga gtg cgc gaa gat etc cga u t a ccg gtc etc gac cac cac ggc 

arg arg ala gly glu gly val arg glu asp leu arg val ala val leu a 3 p hi 3 hi 3 gly 

val gly arg ala 1 y 3 glu cy 3 ala lya lie ser glu AMU arg ser ser thr thr th- ala 
ser gly gly arg arg ser ala arg arg ser pr d sor sor glv uro an nm / r „ 
641/231 871/291 " ' * ^-----^-^ 

ggc ccg tgg cag cgc gge cag ttc ggt cag ttg gta : t 1 caq gtt acc gtt cag cac gee 
giy pro trp gin arg gly gin phe gly gin leu val phe q in val ala val gin his ala 

ala arg gly ser ala ala ser ser val ser trp tyr phe arg Lou pro phe ser thr pro 
-nwinT PI ° Vdl 5Sr Va: 1: - <^3 ser ala arg gin 

aga agt aag gtc cgc caa cgc ttt acg etc gar -y r ■;, cac gac: tig gec ggc cac *tt 
arg ser lys val arg gin arg phe thr leu asp .gly .,r-j his glu 1,-u ai t , gly his phe 

glu vax arg ser ala asn ala leu arg ser thr ala a 1 ,» tnr set trp pro ala thr oh« 
lys OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro ] eu ser 
^ol/JZl 991/331 

cag q-c gta gtc gec gca ggg cag ggc ttc ccg cgt cgt ctt c<;c ggg ttt gtc ggc 'aaa 
gin ala val val ala ala gly gin gly phe pro arg arg leu arq gly phe val gly ly 3 
arg pro AMB ser pro qlr. gly arg ala 3 er arg v.,1 v.,i phe ala r.\y leu ser ala ly, 
g y arg ser arg arg arg ala gly lou pro ala ,,,r s , r oer arg'val cvs arg gin a'ry 

luzi/jll 1 0 5 " ■ ' 3 ' ■ 1 " 

ggt gta ggg gta gcg ttc gtg ggc gtc gac gac cat -j 
gly val gly val ala phe val gly val a;sp asp asp v 
val AMB gly AM Li arg ser trp ala ser thr thr ro- 
c/3 arg gly ser val am gly arg auj aig a:-j 
1081 /361 " - ! ■ ■ rr 



'^y< g*t gec ggc ggc 
' ■ n leu : ; I y asp ala gly gly 
:>>"'!' :^-r gly rr.et pro ala ala 
rlia g-y cy 3 arg arg a::; 



qcy ggc ggt ggg ggt gcg ca: gec egg ccg cga 
ala gly gly giy gly ala his ala arg pre arc 
arg ala val gly val arg t::r p: j gly'arg i': 
gly arg trp giy cya ala arg pro ala ala 
1141/301 



W O 99/09186 



PCT/FR98/01813 



56/1B5 



1321/441 1351/451 

ctt ggt gcg egg cca cac gtc cga ggt ggc gaa gac cag tec cgc gec cac egg cag ccg 
leu gly ala arg pro his val OPA gly gly glu aap gin ser arg ala hLS arg gin pro 
leu val arg gly his thr ser glu val ala lys thr ser pro ala pro thr gly aer arg 
trp cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 
1381/461 1411/471 

gat cag gta ggg cag gcg cga gtc ttc age ggg gtc ggc ggc g dC gag cag etc cac aga 
asp gin val gly gin ala arg val phe ser gly val gly gly asp glu gin leu hi? arg 
lie arg AMB gly arg arg glu aer 3er ala gly leu aid ala thr ger ser ser thr glu 
ser gly arg ala gly a] a ser leu gin arg gly trp arg arg arg ala ala pro gJ n ser 
14 41/461 1471/491 

gtg tga ggg tac ggg egg cgt acg gca acq gtg aag cag gca etc cga cga acc cat cgt 
val OPA gly tyr gly arg arg thr ala thr val lys gin ala >u arg arg thr his arg 
cys glu gly thr gly gly val arg gin arg OPA ser arg his ser a 3 p glu pro ile v tl l 
val arg val arg ala ala tyr gly nr>n cjlv cjlu ala rrlv rh r . 
1501 /501 ' ' ' ' : * "" J " tr 

cac gtc gaa ggg gca ggt ga 
his val glu gly ala gly 
thr ser lys gly qln val 
arg arg arg gly arg OPA 



SEQ ID N° 15Q (suito 2) 
FIGURE 15Q (suite (2) 



WO 99/09186 



PCT/FR98/0I813 



57/185 



GCG CAT GCC GAC CAG 
ala his ala asp gin 
62/21 

GAT ATA ACC ACT CTA 
asp lie thr thr leu 
122/41 

ATG CAT TCG CGA CCG 
met his ser a 15 pro 
182/61 

ACT TCC GTG CCG AAC 
thr ser val pro asn 
242/81 

CTG GCA GTT GG\ AGT 
leu ala val ala ser 
302/101 

CGG CCC GAG CA: CAT 
arg pro glu his hi s 
362/121 

AT G TCC GCG CTA TCG 
met ser ala lei ser 



TGT GGT TGG CCG GAG 
cys gly trp pro glu 

GTC ACA TCA ACC ACA 
val thr ser thr thr 

CGG GAG CCG GCG AAC 
arg glu pro ala a g n 

CGA CGC CGA CGC AAG 
arg arg arq arg lys 

CCT TGT GCA TAT TTT 
pro cys ala Lyr phe 

GAA TTC AAG CAG GCG 
■glu phe lys gin ala 

CAG GGG TTG TCC CAG 
gin gly leu ser gin 



32/11 

TTC GTT TGT TCG CGA 
phe val cys ser arg 
92/31 

CTC GTA CCA TCG AGC 
leu val pro ser ser 
152/51 

CCG GCG CCA CAC ATA 
pre ala pro his lie 
212/71 

CTT TCC ACA GCC ATG 
leu ser thr ala met 
272/91 

CTT GTC TA: GAA TCA 
leu va 1 tyr glu ser 
332/11 ] 

GC'j o 1 j TT ; j ACC GAC 

ala val leu thr asp 

392/ 13 I 

TCC GGG AT C 

phe g] y lie 



TTG CCT CAA CGA TTC 
leu pro gin arg phe 

GTG TGG GTT CAT GCC 
val trp val his ala 

ATC CAG ATT GAG GAG 
ilc gin il- glu glu 

AGC GCG GTC GCC GCC 
ser ala val ala ala 

ACC GAA ACG ACC GAG 
thr glu thr thr glu 

CTG CCC GGC GAG CTG 
leu pro gly glu leu 



SEQ ID N° 16B 



FIGURE 16B 




WO 99/09186 



PCT/FR98/01813 



58/185 



GCG GGC 


CAC 


CGA 


TCA 


GTC 


GAT 


CGG 


GTG 


GTT 


ala gly 


his 


arg 


ser 


val 


asp 


arg 


val 


val 


61/21 














GCA GTG 


ACG 


ACA 


CCA 


GCG 


CAG 


GAC 


GCG 


CCG 


ala val 


thr 


thr 


pro 


ala 


gin 


asp 


ala 


pro 


121/41 
















GGC TCG 


CCT 


TTT 


TTT 


CAT 


CAA 


CGT 


TGG 


ACT 


gly s er 


pro 


phe 


phe 


hi. -> 


gin 


a rg 


trp 


thr 


181/61 


















TTC GGT 


CAC 


CTG 


ACG 


GTC 


GGG 


at: 


TTC 


CTT 


phe gly 


his 


leu 


thr 


val 


gly 


met 


phe 


leu 


7 \\ / 8 1 
















TGC CCT 


GCT 


GGT 


GCG 


GCG 


TTC 


GGC 


CGA 


GTC 


c y s pro 


ala 


gly 


ala 


ala 






arg 


val 


301/101 
















GTC GAT 


GGC 


CCT 


CM 


CTC 




ATC 


G C G 


ACT 


val asp 


g 1 y 


p r o 


gin 


leu 


gly 


ile 


ala 


thr 



31/11 

TCC GCT CCA TCA GCC CGG AAT TGA GGT GCC 
ser ala pro ser ala arg asn OPA gly ala 
91/31 

TTG GTG TTT CCC TCT GTT GCT TTC CCG TCC 
leu val phe pro ser val ala phe pro ser 
] 51/51 

GCC GCA GTG GCG ATG TTG GTC GCC GGC GTG 
ala ala val ala :aet l*_u val ala gly val 
211/71 

GGG TCT CG3 GTT GCT GCT GGG TTT GCT CAA 
gly ser arg val ala ala gly phe ala gin 

? 7 1 / q i. 

GAT CAC CGC :AA AGA GCA CCC GTT AAA ACG 
asp his arg gin arg ala pro val ivs th*- 
331/111 

GGC GAT TAT CAC CAT GCC TCG GGC TGA TC 
g 1 y asp t y r h is hi s a 1 a s e r g 1 v O P A 



SEQ ID N° 17A 



FIGURE 17A 



WO 99/09186 



PCTYFR98/01813 



59/185 



GGG CCA CCG ATC AGT CGA TCG GGT GGT TTC 

gly pro pro xle ser arg ser gly gly phe 
63/21 

AGT GAC GAC ACC AGC GCA GGA CGC GCC GTT 

ser asp asp thr ser ala gly arg ala val 
123/41 

CTC GCC TTT TTT TCA TCA ACG TTG GAC TGC 

leu ala phe phe ser ser thr leu asp cys 
18 3/61 

CGG TCA CCT GAC G3T CGG GAT GTT CCT TGG 

arg ser prD asp gly arg asp val pro trp 
213/81 

CCC TGC TGG TGC GGC GTT CGG CCG AGT CGA 

pLJ cys tip cys cj 1 y val arg pro ser arg 
303/101 

CGA TGG CCC TCA ACT CGG CAT CGC GAC TGG 

arg trp pro ser thr arg his arg asp trp 



33/11 

CGC TCC ATC AGC CCG GAA TTG AGG TGC CGC 
arg ser ile ser pro glu leu arg cys arg 
93/31 

GGT GTT TCC CTC TGT TGC TTT CCC GTC CGG 
gly val ser leu cys cys phe pro val arg 
153/61 

CGC AGT GGC GAT GTT GGT CGC CGG CGT GTT 
arg ser gly asp val gly arg arg arg val 

213/7 1 

GTC TCC GGT TGC TGC TGG GTT TGC TCA ATG 
vaL s^i ;;iy cys cys trp val cvs ser met 

2/3/91 

ser pro pro lys ser thr arg GCH asn gly 

3 3 3/1 1 1 

CGA TCA TCA CCA TGC CTC GGG CTG AT C 
a:~o 1";. :;<-r pro cys leu gly leu ii<> 



SEQ ID K° 17C 
FIGURE 17C 



WO 99/09186 



PrT/FR98/01813 



60/185 



l/l 

get aga acc ccg aag 
aia arg thr pro lys 
61/21 

ggt cgc gec gat tea 
gly arg aia asp ser 
121/41 

ctg cga tac get egg 
leu arg tyr ala arg 
181/61 

gga att gag gtg ccg 
gly lie glu val pro 
241/81 

ttg ctt tec gtc egg 
leu leu ser val arg 
301/101 

tgg Ccg ccq qcq tat: 
trp ser pro ala cys 
361/12 1 

tgg gtt tgc tea atg 
trp val cys scr met 
421/141 

ac: cgt taa aac ggt 
thr arg CCH asn yly 
431/161 

tc; ggc tga te 
ser gly OPA 



gag acc teg egg gtt 
glu thr ber arg val 

cga ccg aca tag gga 
arg pro thr AMB gly 

egg gec acc gat cag 
arg ala thr asp gin 

cag tga cga cac cag 
gin OPA arg his gin 

ttc gee ttt ttt tea 
phe ala phe phe ser 

teg ate acc rnn 
ser val thr CPA arg 

c c e tgc L y y tgc ggc 
pro cys trp cys gly 

cga tgg ccc tea act 
arg trp pro ser thr 



3 1/11 

gec ggc ccc egg ccc 
ala gly pro arg pro 
91/31 

get acc cct tgg gtg 
ala thr pro trp val 
151/51 

teg ate ggg tgg ttt 
ser lie gly trp phe 
211/71 

cgc agg acg cgc cgt 
arg arg thr arg arg 
271/91 

tea ac^ ttg gae tgg 
ser thr leu a:;p trp 
331/111 

teg ggi tgt tct tgy 
ser g] y cys ser trp 
391/131 

gtt eg 3 ccg agt cga 
val ar ; pro a:q 
4 5 1/15 1 

egg cat cgc <; i _ iyy 
arg hi.-, arg asp trp 



ate yya tgc gta tec 
lie gly cys val ser 

att ccg gtg cga cga 
lie pro val arg arg 

ccg etc cat cag ccc 
pro leu his gin pro 

tgg tgt ttc cct ctg 

trp cys phe pro leu 

ccg cag tgg cga tgt 
pro gin trp arg cys 

yi- 1 - Ley ggc tgc tgc 
val ser gly cys cys 

tea ccg cca aag age 
ser pro pro lys ser 

cga tta tea cca tee 
arg lou ser pro ser 



SEQ ID N" 17B' 



FIGURE 17B' 



WO 99/09186 



PCT/FR98/0I813 



61/185 

sequence Rvl303 precUte par Cole ct al . (Nature 393:537-544) el covenant part ieliement 
1/1 31/11 

atg acg aca cca gcg cag gac gcg ccg teg gtg ttt ccc tct gtt get ttc cgt ccg qtt 
met thr thr pro ala gin asp ala pro leu val phe pro 3 er val ala phe arg pro val 
61/21 91/31 

cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ttg gtc gec ggc gtg ttc 
arg leu phe phe He asn val gly leu ala ala val ala met leu val ala gly val phe 
121/41 151/51 

ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg ggt ttg etc aat gec 
gly his leu thr val gly met phe leu gly leu gly lea leu leu gly leu leu asn ala 
181/bl 211/71 

ctg ctg gtg egg cgt teg gec gag teg ate acc gec aaa gag cac ccg tta aaa egg teg 
leu leu val arg arg ser ala g] u .er He thr ala xys glu hua pro leu ly 3 arg 5 er 
241/81 271/91 

acg gec etc aac teg gca teg ega ctg gcg att ate acc ate etc ggg ctg ate ate qce 
met ala leu asn scr ala 3 er arg leu ala He ile thr He leu gly ieu He He ala 
3 01/101 331/111 

tac act ttc egg ccc get gga ttg ggc gtc gtg ttc ggg ctg gca ttc ttc cag gtg ctg 
tyr ile phe arg pro ala gly leu gly val val phe gly : eu ala phe phe gin val leu 
3U/121 391/131 

ctg gtg gca acg acg gec ctg ccg gtc ctg aag aag ctg ccjc: act gcg acc gag gaa err- 
leu yal ala thr thr ala leu pro val leu ly, ly, leu arg thr ala thr clu glu pro 
4?1/141 451/15 1 

gtc gca act tat tct tec aat gyc cag acc ggg gga ccg gaa gga agg age gec age gat 
Isi/lCr S9r gly gln thr 3ly 0 1 * s '-' r 9ly >l: L ,er asp 

gac tga 
asp OPA 

SEQ ID N° 17D 
FIGURE 17D 



Orf d'aprea Cole et al . (Nature 393 ■ r j 37- 544 J er - - 
i/ 1 31/11 

tga ggt gec gca gtg acg aca cca gcg rag gac gcg z 

OPA jly ala ala val thr thr pro ala gin asp ala : ■ 

61/21 9irn ' 

ttc cgt ccg gtt cgc etc ttt ttc ate aac gtt gga ct 

phe dig pi o val arg leu phn pho ile asp. val qlv ;.- 

- ?:/ '* : : ' l ; : ' 

1? 1/61 * " * i 



. Hvl303 

u val pHn pro val ala 

:c gja gtg T - ; tU _ : ; tt „ gtc 

a al a va 1 al \ rrv^- v -< 1 



«.t-u ,i:;n a^a 



WO 99/09186 



PCT/FR98/018I3 



62/185 



31/11 



GTC GAA 


CAG 


GTA 






U ^ o 




TCG 


GTC 


GCT CGG 


TCC 


GCT 


GGT 


ATC 


TCG 


TGT 


TCA 


GCC 


val glu 


aln 


va 1 


arg 


1 VS 


ala 


pro 






ala arg 


ser 


a i a 


gly 


i 1 e 


ser 


cys 


ser 


ala 


61/21 


















qi / 
















LL L? 


1 1 A 


ACG 


TGG 


CCG 


AAC 


AGG 


TCG TCT 


TGG 


GGT 


CGG 


GCA 


TCA 


GCG 


TCG 


ATG 




arg 


pr O 


1 6 U 


li i r 


t rp 


pro 


asn 


a rg 


ser ser 


trp 


gly 


arg 


ala 


ser 


ala 


ser 


met 


121/41 
































TGG CTC 


AGG 


TCG 


ATA 


CCC 


GAG 


GGG 


ATG 


GCA 


AGT GTC 


ACC 


CCG 


CCA 


TCC 


TTC 


CAC 


CTC 


TTT 


trp leu 


arg 


ser 


lie 


pro 


glu 


gly 


met 


ala 


ser val 


thr 


pro 


pro 


ser 


phe 


hi s 


leu 


phe 


181/61 


















211/71 














TCG GGT 


GCA 


AC 3 


ATC 


GGG 


CCA 


TGC 


CT 3 


ACG 


GGG AGC 


AGA 


GCC 


AGC 


CAC 


CGG 


CCC 


AAG 


AAG 


s e r g 1 y 


ala 


thr 


lie 


gly 


pro 


cys 


leu 


thr 


gly ser 


arg 


ala 


ser 


his 


a rg 


pro 


lys 


lys 


241/81 


















271/91 










ATG CGG 


AAG 


AC 3 


ACT 


CGC 


GGC 


CCG 


AC 3 


CCG 


CGG AGG 


CCG 


CCG 


CGG 


CCG 


AAC 


CTA 




CAT 


met a r g 


lys 


thr 


thr 


arg 


gly 


pr3 


thr 


p ro 


arg arg 


p ro 


pro 


arg 


pro 


asn 


pro 


a s n 


h i s 


301/101 


















331/111 












CAG CCG 


GTC 


CCG 


ATG 


TTC 


TCG 


ac: 


TAG 


GGT 


ATC GCC 


TCG 


ACA 


CTA 


CTC 


GGC 


GTG 


CTA 


TCG 


qln pro 


val 


pro 


me z 


p hi e 


ser 


thr 


tyr 




1 1 m a I a 


s e r 


t h r 


1 e u 


leu 


gly 


va 1 


J eu 




361/121 


































GTC GCC 


GCG 




GTG 


Ci'L> 


GGT 


GCG 


ATG 


ATC 




















val ala 


a ) a 


Val 


va 1 


leu 


gly 


ala 


met 


lie 





















SEQ ID N 0 18A 

FIGURE 18A 



3 2 



WO 99/09186 



PCT/FR98/01813 



3/1 

CGA ACA GGT ACG 
arg thr gly thr 
63/21 

CCA GCG GCC GTT 

pro ala ala val 
123/41 

GCT CAG GTC GAT 

ala gin vaJ a?p 
183/61 

GGG TGC AAC GAT 

gly cys asn asp 
243/81 

GCG GAA GAC GAC 

a i a g 1 u asp asp 
333/101 

j^C GGi' CCC GAT 

ala gly pro asp 
363/121 

LjC CGC GGT CGT 

arg arg gly arg 



GAA GGC GCC GTC 
glu gly ala val 

AAC GTG GCC GAA 
asn val ala glu 

ACC CGA GGG GAT 
t\h r a rg gl y asp 

CGG GCC ATG CCT 
arg ala mot pro 

TCG CGG CCC GAC 
s e r arg pro a s p 

GTT CTC GAC CTA 
val leu asp leu 

GCT GGG TGC GAT 
ala gly cys asp 



63/185 



33/1 1 
GGT CGC TCG GTC 
gly arg scr val 

93/31 
CAG GTC GTC TTG 
gin val val leu 

153/M 
GGC AAG TGT CAC 
gly ly? cys r.is 

213/71 
GAC GGG GAG CAG 
asp gly g]u qj; ; 

">ii ( ; 
GCC GCG GAG GC C 
li.i ala ■; 1 !; 1 j 



GAT C 
asp 

SEQ ID N° 18C 
FIGURE IRC 



CGC TGG TAT CTC 
arg c rp tyr leu 

GGG TCG GGC ATC 
gly ser gly ile 

CCC GCC ATC CTT 
p r a a la i 1 c leu 

AGC CAG CCA GCG 
s a : g In p r o pro 

CCC GCG GCC GAA 
* 1 a ala ala g 1 u 

:-AC ACT ACT CGG 
iop rnr tr.r a :. g 



GTG TTC AGC CAG 
val phe ser gin 

AGC GTC GAT GTG 
ser val asp val 

CCA CCT CTT TTC 
pro pro leu phe 

GCC CAA GAA GAT 
ala gin glu asp 

CCC AAA TCA TCA 
pro lys ser ser 

CoT GCT ATC GCC 
arg ala lie gly 



WO 99/09186 



PCT7FR98/01813 



64/185 



1 / 1 

1/ 1 










CGG AAG 


GCG 


CCG 


TCG 


GTC 


a r g 1 y s 


aid 


p ro 


se r 


vai 


ox / i. 1 










ix A ACG 


TGG 


CCG 


AAC 


AGG 


leu thr 


trp 


p ro 


asn 


a rg 


1 <i 1 / Hi 










ATA CCC 


GAG 


GGG 


ATG 


GCA 


lie pro 


glu 


gly 


met. 


aid 


131/61 










ATC GGG 


CCA 


TGC 


CTG 


ACG 


ile gly 


pro 


cys 


leu 


thr 


241/81 










ACT CGC 


GGC 


CCG 


ACG 


CCG 


thr arg 


gly 


p ro 


thr 


pro 


301/101 










TGT TCT 


CGA 


CCT 


ACG 


GTA 


cys s e r 


nrg 


pro 


thr 


va 1 


361/121 












GTG 


CGA 


TGA 


TC 


cys trp 


va 1 


arg 


OPA 













31/11 




GCT 


CGG 


TCC 


GCT 


GGT ATC 


TCG 


a 1 a 


arg 


ser 


ala 


gly ile 


ser 










91/31 




TCG 


TCT 


TGG 


GGT 


CGG GCA 


TCA 


se r 


se r 


trp 


gly 


arg ala 


ser 










151/51 




A3T 


GTC 


ACC 


CCG 


CCA TC 3 


TTC 


m e r. 


va 1 


thr 


pr- 


pro ser 


phe 










211/71 






AGC 


AGA 


GCC 


AGC CAC 


G *jj 


gly 


ser 


arq 


ala 


ser his 


arg 










2 71/91 




CGG 


AGG 


CCG 


CCG 


CGG CCG 


AAC 


arg 


arg 


pro 


pro 


Ljrg pro 


as:; 










331/111 




T CG 




CGA 


CAC 


TAC TCG 






arg 


h l o 




a 1 a 



TGT TCA GCC AGC CAG CGG CCG 
cys ser ala ser gin arg pro 

GCG TCG ATG TGG CTC AGG TCG 
ala ser met: trp leu arg ser 

CAC CTC TTT TCG GGT GCA ACG 
his leu phe ser gly ali thr 

CCC AAG AAG ATG CGG AAG ACG 
pro ly.s I ys met arg lys thr 

CCA AAT CAT CAG CCG GTC CGA 
pr:) asn his gin pro va I arg 

TGO TAT CGG TCG CCG CGG TCC 
::ys tyi arg ser pro arg ser 



SEQ ID N° 18B' 
FIGURE 183* 



WO 99/09186 



PCT/FR98/01813 



65/185 



sequence RvOI99 predite par Cole et al . (Nature 393:537-544) et contenant 
s s q 1 B A 



1/1 31/11 

atg cct gac ggg gag cag age cag cca ccg gec caa gaa gat gcg gaa gac gac teg egg 

Met pro asp gly glu gin ser gin pro pro ala gin glu asp ala glu asp aso ser arq 
01/21 91/31 

ccc gac gec gcg gag gec gec gcg gec gaa ccc aaa tea tea gee ggt ecg atg ttr tea 

pro asp ala ala glu ala ala ala ala glu pro lys ser ser aia cly oro ir-t pV- s~ r 
121/41 151/51 



.ice tae ggt ate gee teg aca eta etc gge gtg eta t.eg gte gee geg gtc gtg etg ggt 

thr tyr giy He ala ser thr leu leu gly val leu S er val ala ala val val leu glv 

.31/61 211/71 ' 

yCy uly tgg tec gca eae cge gat gac tec gge gag cgt ace tae etg ace egg ate 

dsp a5p SCr ^ * lu ar ? thr ^ ^ thr arg val 
-41/81 271/91 

atg etg ace gee get 3 aa tqq aeg gee gtg etg at. aac arg anc gee gac aae ate gat 
rnet o« tnr ala ala glu trp thr ala val leu He asn met asn d l d a,p asr. Ho 
jOI/101 331/111 

gtc ggt 
val glv 
391/131 



c,ee age etg cag ega ,tg cac gae gga acg gtc ggt caa etc aae ace gae tte gac q.~ 

a.a ser leu gin arg leu his asp gly thr val gly gin leu asn thr asp phe asp ala 

j. o 1 / I Z 1 3 91/131 

etc gtg cag ccc tae egg cag gtg gtg gag aag ttg egg acg eae age age gge agg ate 

g * a P1 '° tyr ,rg gln Val val ^ ieu arg thr his ser ser gly arg He 

'»2i/141 451/151 

gag gcg gta gcg ate gat acg gtg eae cge gag etg gat ate cag tec ggt gec gec cga 

^si/lei " • 1 j -ip^ dsp L r g - n ser g ^ aia ^ ^ 



pro val val tnr th 



ccg gta gta acc acg aaa ttg cca ccg ttt gec act cgc acc gac teg gtg etg etg gtr- 

t: - Pro pro pho ala thr arg thr sc: val leu leu val 

-:i/xdl r >7 w 

geg acg teg gte aqt gag aae gec gqc gee aaa ccc cag av: qt:; ca e teg aac — 

a ; a ,;^ r ser vaL ser ? iu asr - aia a l-i I V5 pre gle t:>.; va . : r: , a ^ ~ ~.V! ~V.[ 



lea aep val eer aso va: ace r : l v : v «; 



ei t : 



.ir: v ID N 



rTGURK 18D 



WO 99/09186 



PCT/FR98/018I3 



66/185 

ORF d'apres Cole et al . (Nature 393:537-544] ct covenant Rv0199 
1/1 31/11 

taa tec gat gec gga ttg ggt gaa atg cac caa gta acg ggt cga gtc ttt gga ate ggt 
OCH ser asp ala gly leu gly glu met his gin val thr gly arg val phe qlv lie alv 
61/21 91/ 31 ^ y y y ne giy 

ate gac ata gac tec gat gec gec gec cac gec ggc acg ttg cag agt gec aag ggc ggc 

lie asp lie asp ser asp ala ala ala his ala gly thr leu gin ser ala lvs alv alv 

121/41 151/51 y 9iy giy 

ggc caa ttc ggt ggc gtc ggc ego get gtc aat cgt gqc caa ttc gtc gtg cag rgg ttg 

gly gin phe gly gly val gly arg ala val asn arg gly gin phe val val gin arg leu 

181/61 211/71 

cac ccc tgc gcg etc gac gqc ttc etc gtc gag gaa get ygc gta gag gtc gee gat gcg 

his pro cys ala leu asp gly phe leu val glu glu ala gly val glu val ala asp ala 

241/81 271/91 

ctg egc ate ggt grc tae cgc age aec tgc ttg get ggc ctg gat gat cag gtc teg cac 

\ e "* r * lle qly ala tvr ara 3er rhr ^ ^ ^ 51 y leu asp gin va, ser his 

301/101 331/111 

ttg tgt etc ggc gcg gtc gaa cag get acg gaa ggc gec gec ggr. cgc teg gtc cgc tag 

leu cy3 leu gly ala val glu gin ala thr glu gly ala val gly arg ser val arg trp 
361/121 391/131 

rat etc gtg ttc age cag eca gcg gee gtt aac gtg gec gaa cag gtc gtc ttg ggg teg 

tyr leu val pne ser gin pro ala ala val as:i val ala glu gin val val leu gly se- 
421/141 451/151 

ggc ate age gtc gat gtg get cag gtc gat aec cga ggg gat ggc aag tgt cac ccc gec 

gly He ser val asp val ala gin val asp thr arg gly asp gly lys cys hi m p-o ala 
481/161 511/171 

ate ctt cca cet ctt ttc ggg tgc aac gat egg gec atg cct gac ggg gag cag age cag 

lie leu pro pro leu phe gly cys asn asp arg ala net pro asp gly glu gin 3 cr c > n 
541/181 571/191 

cca ccg gee caa gaa gat gcg gaa gac gac teg egg ccc gac gec gcg gag gec gee gcg 

pro pro ala gin glu asp ala glu asp asp ser arg pro asp ala ala glu ala ala ala 



601/201 " " 631/m 

gee gaa ccc aaa tea tea gec ggt ccg atg ttc teg aec tae ggt ate gee tec, ara rta 

ala glu pro lys ser ala gly pro r.nt ph* ser thr tyr gly He ala ser thr leu 

o6i/221 691/231 

: l - ^ c r.-g crc qrc gcg etc etc ctg get gcg atg r.c tgg tec gc, ; cac cr t - 

-eu gly va. ser val ala ala val val > i c;] y -''a ^ - ^ --^ *-n - -> - v, , „ ^ 

eat gac tec qgc gag cgt aec tae ctg a c j c j 



ace 



/ glu arg thr tyr leu thr arg v,i t >u thr ala 

73 1/2 6 1 8 1 1/27: 

err gtg ctg ate aac at; ai;; ccc :;ac a i at.; r y: - , 7 

val Ivu :le ; rc. .r.a a--. : 1 - - ,;a 

• ; :/.:? 1 / : 



t.ru t: 



1 / J 1 



i i i •. i 



WO 99/09186 



PCT/FR98/01813 



67/185 



31/ 

GT 



GCG CAA CGG GGT GAG CAC CGA CGC GAT GAT GGC GCA ACT ATC GAA ACT GCA GGA CAT 

va lara gin arg gly glu hi. arg arg asp asp gly ala tht lle glu thr ^ £J «J 

Oi/^1 91/31 

CGC CAA CGC CAA CGA CGG CAC TCG CGC GGT GGG CAC CCC TGG CTA TCA GGC CAG CGT CGA 

arg^gln arg gin arg arg his sen arg gly g ly^ s pro trp leu ser gly ™ ^g ^ 

CTA TGT GGT AAA CAC ACT GCG CAA CAG CGG tJt'tGA TGT GCA AAC CCC GGA GTT CTC CGC 
leu^cys gly lys h,s thr ala gin gin arg p^OPA cy, ala asn pro gly val leu arg 

TCG CGT oTT CAA GGC CGA AAA A3-3 GGT GGT GAC CC? CGG CGG CAA CAC CGT GGA G r C CAr 

n;,;; 9 vai gln giy arq lys ^ giy arq gin h - ^ ^ ^ ™ 

GGC GCT CGA GTA CAG CCT CGG CAC ACC GCC GGA CGG GGT G*C r;~r rrr ^ _ 

giy ala arg val gin pro arg his thr aia glv acq ily a^r c^V, IT I T T~ 

30 1/101 t-wiT, p 9-V cys 

CCJ CGC CGA CGA CAG TCC GGG CTG CAG ICC GTc'gGA CCA CGA CAG GC" GC~ — n r - 

pro arg arq arg gln ser glv leu gin s-r vi- r ^i. -i n / ° * "* ^ 

361/122 ' ^' ' J 1 J dIa ala vai arg 

TGC GGT GGT GCT GGT AG A TC 

cv: giy aly ala gly arg 



SEQ ID N° 19A 
FIGURE 19A 



WO 99/09186 



PCT/FR98/018I3 



68/185 



33/11 

TGC GCA ACG GGG TGA GCA CCG ACG CGA TGA TGG CGC AAC TAT CGA AAC TGC AGG ACA TCG 

cys ala thr gly OPA ala pro thr arg OPA trp arg asn tyt arg asn cys arg thr ser 
63/21 93/31 

CCA ACG CCA ACG ACG GCA CTC GCG CGG TGG GCA CCC CTG GCT ATC AGG CCA GCG TCG ACT 

pro thr pro thr thr ala leu ala arg trp ala pro leu ala He arg pro ala ser thr 
123/41 153/51 

ATG TGG TAA ACA CAC TGC GCA ACA GCG GTT TTG ATG TGC AAA CCC CGG AGT TCT CCG CTC 

met trp OCh thr his cys ala thr ala val l eu met cys lys pro arg se r ser pro leu 

1 d 3/ o 1 213/71 

GCG TGT TCA AGG CCG AAA AAG GGG TGG T2A CCC TCG GCG GCA ACA CCC TGG AGG CGA GGG 

a a cys ser arg pro lys lys gly trp OPA pro ser ala ala thr pro trp arg arg gly 
243/81 2 7 3/91 * J d y^y 

CGC TCG AGT ACA GCZ TCG GCA CAC CGC CGG ACG GGG TGA CGG GCC CG 2 TGG TGG CTj CCC 

'^nni ^ U1 * ar(j Cnr giy ° PA at< * ala ar '? tr P tr P leu pro 

303/101 333/111 

CC2 CCG ACG ACA GTC CGG GCT GCA GTC CGT CGG ACT ACG ACA CCC TG^ CGG TG"' C- ' GT~ 

pr:> pro thr thr val arg ala ala val arg arg thr thr rh: ;: : v ; ^ c-' ^ 
353/121 " J 1 ■ *" g va * 

CGG TGG TGC TGG TAG ATC 

arg trp cys trp AMD lie 



SKQ ID N° 19C 
FIGURE 19C 



WO 99/09186 



PCT/FR98/0I813 



69/185 



^ 31/11 

TAT CGA AAC TGC AGG ACA TCG CCA ACG CCA ACG ACG GCA CTC GCG CGG TGG GCA CCC CTG 
tyr^arg asn cys arg chr ser pro thr pro thr^thr ala leu ala arg trp ala pro leu 

GCT ATC AGG CCA GCG TCG ACT ATG TGG TAA ACA CAC TGC GCA ACA GCG GTT TTG ATG TGC 

ala lie arg pro ala ser thr met trp OCH thr his cys ala thr ala val leu met cys 
lil/41 151/5] Y 

AAA CCC CGG AGT TCT CCG CTC GCG TGT TCA AGG CCG AAA AAG GGG TGG TGA CCC TCG GCG 

.ys pro arc ser ser pro leu ala cy S ^ arg pre ly,, iys giy tfp 0PA pro ^ ^ 
1S1/61 211/71 

GCA ACA CCG TGG AGG CGA GGG CSC TCG AGT ACA GCC TCG 3CA CAC CGC CGG ACG GGG TGA 

2U/S r Pr ° " 9 gly ar ' ? Ser ser 2 %yr a ser ala hls ar * 9iy OPA 

CGG GCC CGC TGG TGG CTG CCC CCG CCG ACG ACA GT: CGG GCT GCA CTC CGT CGG ACT ACG 

arg ala arg trp trp leu pro pro po thr thr val ar 3 ala ala val arg arg thr t hc 

jsui/iui 331/111 

ACA GGC TGC CGG TGT CCG GTG CGG TGG TGC TGG TAG ATC 

thr gly cys aiy c:ys pro val arg trp cys trp AN3 il tJ 

SEQ ID N° 19B' 
FIGURE 193' 




WO 99/09186 



FCT/FR98/01813 



70/185 

sequence Rv0418 predate par Cole et al . (Nature 393:537-544} et contenant 
seql9A r 

1/1 31/11 

atg gtg aac aaa tec agg atg atg ccg gcg gtg ctg gec gtg get gtg gtc gtc gca ttc 
Met val asn lys ser arg met met pro ala val leu ala val ala val val val ala phe 
61/21 91/ 31 

ctg acg acg ggc tgt ate egg tgg tct acg cag teg egg ccc gtt gtt aac ggc ccc get 
Leu thr thr gly cys ile arg trp ser thr qln ser ara pro val val a ? n gly p r Q -la 
121/41 151/51 

gec qca gag ttc gee gtt gcg ttg cgc aac egg gtg age acc gac gcg atg .ctg gcg ca~ 
ala ala glu phe ala val ala leu arg asn arg val ser thr asp ala met met ala his 
181/61 211/71 

eta teg aaa ctg cag gac ate gec aa: gec aac gac ggc act cgc gcg gtg ggc acc cc- 
leu ser lys leu gin asp lie ala as:i aid asp. asp gl v thr ara ala v^ niv -k. 
241/81 271/91 " ' J J 

jgc tat cag gec age gtc gac tat gtg qta aac aca ctg cgc aac age ygt ttt gat gtg 
jly tyr gin ala ser val asp tyr val val asn thr leu arg asn ser gly ph- ass va ' 
- n 1/101 331/111 " 

-aa acc ccg gag ttc Lee get eye gig ttc; aag gee ga a aaa ggg gtg gtg aee etc gg~ 
gin thr pro glu pne ser ala arg va. phe lys ala glu lys gly val val thr leu qlv 
3 o 1 / 1 2 1 3 91/131 

ggc aac acc gt 3 gag gcg agg gcg etc gag tac age etc ggc aca ccg ccg gac ggg gtg 
9-y asn thr Vcil 9 Ul a ^ ^9 ala leu glu tyr ser leu gly thr pro pro asp gly val 
421/141 451/151 

acg ggc ccg ctg gtg get gec ccc gee gac gac agt ccg ggc t gc agt ccg teg gac tac 
thr gly pro leu val ala ala pro ala asp asp ser pro gly eys ser pro ser- ass tv- 
431/16L Sll/171 

gac agg ctg ccg gtg tee ggt gcg gtg gtg ctg gta gat cgc ggc gtc tgt cct ttt ge- 
asp arg leu pro val s-r gly ala val val leu val asp arg gly val cvs ore one ala 
541/18 1 5 71/191 

cag aag gaa gac gca gec 3 cg cag eg:; ggt gcg gtg gcg etg at- art get gac aac at:: 
g..n iys giu asp ala a. a ala gin are glv ala val ala leu ;1- 1 1 « ala asr i K- • 

^ 1/201 ^:il/211 

■aac. ga ; jug geg a: ; g : • gge -rg g : ; get aat act gac Ttc aau »♦ • - * ; 

qlu ^ thr leu gly aia asn rh: asp val lys He n m val vl' 

ub 1/221 691/231 

agt gtc ace aag teg gtc gaa ttc cag eta ege qqa cag tct aag cca acc a < 



a a - ; 



n r 



1/261 



^ c a i ■ a "1 ' c ; ■ t :: c gu i gtg 



t UK ; f i'L -:F:MFU..A2;r.Vr r/[ k r GL L 2-. 



WO 99/09186 



PCT/FR98/01813 



71/185 



1021/341 

tat ctg aac ttc gac atg ttg 
tyr leu asn phe asp met leu 
1081/361 

cag teg ctg ccg eta gac gec 
gin ser leu pro leu asp ala 
1141/381 

gag cgc acg ttc gtc gec tat 
glu arg thr phe val ala tyr 
1201/401 

gac ggt egg tec gac tac gac 
asp gly arg scr asp tyr asp 
1261/421 

tec ggc get: gag gtc aag aag 
ser gly ala glu val ] ys ] vs 
1321/441 

qag cct ttc gat ccc aac tat 
g 1 - pro phe asp pro asp. t v r 
1351/451 

gcg etc ggt ate aac ggc get: 
ala leu gly lie asn gly ala 
14 41/4B1 

ggc ggc ccc aac ggg gtt ccg 

gly gly pro asn gly val pro 

1501/501 

tga 

0?A 



1051/351 
gcg teg ccg aac ccg ggc 
ala ser pro asn pro gly 

1111/371 
cgc ggt cag ccg gtg gtg 
arg gly gin pro val val 

1171/391 
ctg aag atq gec ggc aag 
leu lys met ala giy lyc, 

12 31/4 11 
ggc ttc a eg erg jcg ggt 
gl y phe thr leu .ilu g 1 y 

1 2 ? 1 '431 
tec gec gag caa jee qaq 
s e r a la glu q 1 n 1 1 a q .1 u 

: 3 h ] ' 4 5 1 " 
cac cag aag a :<i .> • • 

1 4 1 1 ' 4 7 1 
ggc gtc gcg tac <:cq q 
gly va 1 ala tyr .ila v.t : 

1471,43 1 
gtc atg gcg gac cgc ace 
val met ala asp erg thr 



tac ttc acc tac gac ggt gac 
tyr phe thr tyr asp gly asp 

ccc gaa ggc teg gec ggt ate 
pro glu gly ser ala gly ilc 

acc gcg cag gac acc teg ttc 
thr ala gin asp thr ser phe 

ate cct teg ggt ggc ctg ttc 
:le pro ser gly gly leu phe 

etc tgg ggc ggc acc gec gac 
lea trp gly gly thr aia asp 

ct g aac cat ate gac cgc acc 
lea asp his :le asp arq th: 

g 3 1 ttg tat g c q cag gac etc 
gly leu tyr ala gin asp lea 

cgc cac ctg att gec aaa ccg 
arg his leu ;. 1 e aid lys pre 



SEQ ID N 1 i:o (r,Mi to) 



WO 99/09186 



PCT/FR98/01813 



72/185 



OHF d'apres Cole et al . (Nature 393:537-544) er contenant Rv0418 
1/1 31/11 

»m« 9 f a ^ 9 " C9t " 9 a " 99t Cgg Cgg gat g cg aaa get gcg egg cga 

AMD ala He gin arg ser val arg leu Ue gly arg Up asp ala lys La ala arg arg 
61/21 91/31 y 

cag gcg cgg tcr. aat ctg ggc gcg atg gcg aac aaa tc. agg atg atg ccg gcg gtg ctq 
gin a a arg ser asn leu gly ala met val asn 1 ys ,er arg net met pro ala val leu 

151/51 

gec gtg get gtg gtc gtc. gca ttc cU; .eg acg ggc tgt ate cgg tgg tct acg cag teg 
1^/61 " " " ^ thr ^f/j!/ r >- ile a - trp ser thr gin ser 

r.ca rr:r nt t nt t- ^ ^ _ _ „ 

" , T ' " y " ' J "^ ^ 1 - L ^ J v ^ : ' : Scg ttg cqe aar can ata 

111*1° val val asn gly " : * ^ ^ Jla val al * le " " g ■« «2 !3 

age acc gac gcg atg atg gcg cac eta teg aaa'eU, e.,n gae ate gec aac gec aac gac 
Tr.Aoi ' "' r " ^ ' ' ^ asn La L 



gly thr arg ala val gly thr pro il'y ty r c:lr. a 1 a -m- ^ 

361/121 ^ ' * -91/13] " ' ^' 

ctg cgc aa: age ggt ttt gat gtg caa acc ;:cg qaq tt- tec act c 



ggc act cgc gcg gtg ggo acc cct ggc tat cag gec age etc gac tat gtg gta aac aca 

asp tyr val val asn thr 

leu arg asn ser gly phe as D val qln t-- — o ->7! -v, ! ~ ,~ '"! T* C9 ° 9t ? qZZ 

421/141 - ' -TV ' 1 drg Va phe lys 

i: & s £ s; o'H? ^ :« ™ c " »= •«= 

481/161 -V;,^; 1 ala ^ e ' J 9 lu tyr scr 

gg r. ; C2r] : gac ggg g - a p- g ^ ^ gec g a= g ae act 

leu gly tt:r pro asn cly va ^ ; - ■, ^ ., * . . , ' ^ 

5-tl/ L8L ' " *' J : " ^ ^ J Fr ° ala ™ 



'1/1-1 



■:;c 1/201 



ggc tge agt ccg teg ga; 
gly eye ror pro sr.r ac;- 



dr 3 g^y »'.!. cy:; pro pn- „i 1 a 



a j ■ 



W O 99/09186 



PCT/FR98/01813 



73/185 

1021/341 1051/351 

tgq ggc gcc gag gaa ttc ggc ctg att ggg tea cga aac tac gtc gag teg ctg gac ate 
trp gly ala glu glu phe gly leu lie gly ser arg asn tyr val glu ser leu asp ile 
1081/361 1111/371 

gac gcg etc aaa ggc ate gcg ctg tat ctg aac ttc gac atg ttg gcg teg ccg aac ccg 
asp ala leu lys gly lie ala leu tyr leu asn phe asp met leu ala ser pro asn pro 
1141/381 1171/391 

ggt tac ttc acc tac gac ggt gac cag teg ctg ccg eta gac gcc cgc ggt cag ccg gtg 
gly tyr phe thr tyr asp gly asp gin ser leu pro leu asp ala arg gly gin pro val 
1201/401 1231/411 

gtg ccc gaa ggc teg gcc ggt ate gag cgc acg ttc gtc gcc tat ctg aag atg gcc ggc 
val pro glu gly jer ala gly lie gxu arg thr phe val ala tyr leu lys met ala gly 
1261/421 1291/431 

aag acc gcg cag gac acc teg ttc gac ggt egg tec gac tac gac gg: ttc acg ctg qcg 
lys thr ala gin asp thr ser phe asp gly arg ser asp tyr asp gly phe thr leu ala 
13 21/441 1351/151 

ggt ate cct teg ggt ggc ctg ttc tec gg z get gag gtc aag aag tec gcc gag caa gcc 
gly lie pro ser gly gly leu phe ser gly ala qlu val lys lys ser ala glu gin ala 
1381/461 1411/471 

ga] etc tgg ggc ggc ac: gcc gac gag cct ttc gat ccc aac tat; cac cag aag aca gac 
glu leu tip gly gly thr ala asp glu pro phe a so pro asn tyr his gin lys thr asp 
1411/481 1471/491 * ■ 

aci ctg qac cat ate qac cgc acc gcg etc ggt ate aac ggc get ggc gtc gcg tac gcg 
thr leu asp his lie asp arg thr ala leu gly ile asn gly ala gly val ala tyr ala 
1501/501 1531/511 

gtg ggt ttg tat gcg cag gac etc ggc ggc ccc aac ggg gtt ccg gtc atg gcg gac cgc 
val gly leu tyr ala gin asp leu gly gly pro asn gly val pru val nv;>t ala asrr arg 
1561/521 

ac: cgc cac ctg att gcc aaa ccg tga 
thr arg his leu lie ala lys pro OPA 

SEQ ID N° 19F (suits) 
FIGURE 19F (suite) 



i •] ; / ( 



- ■ VP: ACLIYlt-N ; Pf , -.i 



WO 99/09186 



PCT/FR98/01813 



74/165 



32/11 



GAG ACA 


GTG 


GTG 


CGG 


cap 


i 




GTT 


CGG 


CTG CTA 


ACG 


ACG 


CCA 


GAG 


TCG 


CCC 


GCT 


TCC 


g 1 u t h r 


Vdi 


Vd 1 


a r g 


asp 


t- u „ 

enr 


OPA 


val 


arg 


leu leu 


thr 


thr 


pro 


glu 


ser 


pro 


ala 


ser 


62/2 1 


















92/31 














GCG GTG 


TGG 


GAC 


TCA 


CGT 


TCG 


GTG 


AGG 


GTA 


CAG CGG 


ACC 


TTC 


GAG 


CAC 


GCA 


ATA 


TCG 


TGG 


dls val 


t- r-r*» 

trp 


asp 


ser 


arg 


ser 


va 1 


arg 


va I 


gin arg 


thr 


phe 


glu 


his 


ala 


ile 


ser 


trp 


122/41 


















152/51 














GCC GGC 


TGG 


CAA 


CCG 


TCG 


GTT 


TCG 


ACG 


TTG 


GTG ACG 


ACC 


CCT 


CGT 


TCA 


TGA 


ATC 


GTT 


CTT 


ala gly 


trp 


gin 


pro 


ser 


val 


ser 


thr 


leu 


val thr 


thr 


pro 


a rg 


ser 


OPA 


ile 


va 1 


lou 


182/61 


















212/71 














GAG CTC 


CCC 


GTT 


TTG 


CTG 


GAT 


GCC 


CAG 


GCA 


CCG CCG 


GTA 


CTG 


CTG 


CGC 


TTA 


AGC 


TTG 


TCG 


glu leu 


pro 


val 


leu 


leu 


asp 


ala 


gin 


ala 


pro pro 


val 


leu 


leu 


arg 


leu 


ser 


leu 


ser 


242/81 


















272/91 
















CAC ATG 


GTG 


CCG 


GCA 


GGG 


AGG 


AAC 


AGT 


GG ( _> 


CAA GCA 


GCT 


AGC 


CGC 


GCT 


CGC 


CGC 


GCT 


GGT 


his met 


v,* 1 


p ro 


ala 


gly 


arg 


as n 


ser 




gin ala 


ala 


ser 


arg 


ala 


arg 


arg 


ala 


gly 


302/101 


















332/L11 
















CGG TGC 


GTG 


CAT 


GCT 


C CC 


AGC 


CGG 


ATG 


CAC 


CA-\ CGT 




C G A 


C <o \j 


GAC 


CGC 


CGT 


GGC 


TGC 


arq cys 


val 


h!3 


ala 


arg 


ser 


arg 




his 


gl:. dry 


gly 


arg 


arg 


asp 


arg 


arg 




cys 


362/121 




























CGA CAA 


ATC 


CGG 


ACC 


ACT 


GCA 


T C A 


GGA 


TC 




















aire j gin 


ile 




thr 


r. h r 


ala 


ser 


gly 























SEQ ID N u 20B 
FIGURE 20B 




c 4 3/^ ; 

A .* \ i < - 



- > VP i. ACT VFNT f-i 



WO 99/09186 



PCT/FR98/0I813 



75/185 

partie de la sequence nucl eo t idique de seq20A 
1/1 31/11 

TGT GGG ACT CAC GTT CGG TGA GGG TAC AGC GGA CCT TGG AGC ACG CAA TAT CGT GGG CCG 
cys gly thr his val arg OPA gly tyr ser gly pro ser ser thr gin tyr arg qlv oro 
61/21 91/31 7 P 

GCT GGC AAC CGT CGG TTT CGA CGT TGG TGA CGA CCC CTC GTT CAT GAA TCG TTC TTG AGC 
ala gly asn arg arg phe arg arg trp OPA arg pro leu val his glu ser phe leu ser 
121/41 151/51 

TCC CCG TTT TGC TGG ATG CCC AGG CAC CGC CGC TAC TGC TGC GCT TAA GCT TGT CGC ACA 
ser pro phe cys trp met pro arg his arg arg tyr cys cys ala OCH ala cys arc thr 
121/61 Cll/71 

TGG TGC CGG CA3 GGA GGA ACA GTG GGC AAG CAG CTA GCC GCG CTC GCC GCG CTG GTC GGT 
trp cys arg gla gly gly thr val gly lys gin leu ala ala leu ala ala leu val alv 
241/81 271/91 

GCG TGC ATG CTC GCA GCC GCA TGC zrr i&r r.Tr. — , - ■ — - ~~ - 

~ ^ ...... ....... ..j-.. o^,\_ l J IjLI Lx^L. IjAC 

ala cys met leu ala ala gly cys thr asn val val asp gly ihr ala val ala ala asp 

301/101 

AAA TCC GGA CCA CTG CAT CAG GAT C 

lys ser gly pro leu his jln asp 



SEQ ID N 3 20A 
FIGURE 2 OA' 



1/1 3 1/:; 

GTG GGA CTC ACG TTC GGT GAG GGT ACA GCG G.A " CTT CGA G Z3C AAT ATG GTG GGC CGG 
va] gly leu thr phe gly glu gly thr ala a:;: ■ ,. r -: .A : - : - ■; a s r: - 1 o V( P J-' 



WO 99/09186 



PCT/FR98/01813 



76/185 



l/l 

GTG TGG GAC TCA 
val trp asp ser 
61/21 

GGC TGG CAA CCG 
gly trp gin pro 
121/41 

CTC CCC GTT TTG 
leu pro val leu 
181/61 

ATG GTG CCG GCA 
met val pro ala 
241/81 

TGC GTG CAT GCT 
cys val his ala 
301/101 

CAA ATC CGG ACC 
gin lie arg thr 



CGT TCG GTG AGG 
arg ser val arg 

TCG GTT TCG ACG 
ser val aer thr 

CTG GAT GCC CAG 
leu asp ala gin 

GGG AGG AAC AGT 
gly arg asn aec 

CGC AGC CGG ATG 
arg scr arg met 

ACT GCA TCA GGA 
thr ala ser gly 



31/11 
GTA CAG CGG ACC 
val gin arg thr 

91/31 
TTG GTG ACG ACC 
leu val thr thr 

151/51 
GCA CCG CCG GTA 
ala pro pro val 

211/71 
GGG CAA GCA GCT 
gly gin ala ala 

271/91 
CAC CAA CGT GGT 
hi 3 qln arg gly 

TC 



SEQ ID N° 



TTC GAG CAC GCA 
phe glu his ala 

CCT CGT TCA TGA 
pro arg ser CPA 

CTG CTG CGC TTA 
leu leu arg leu 

AGC CGC GCT CGC 
ser arg ala arg 

CGA CCjG GAC CGJ 
arg arg asp arg 



20C ' 



ATA TCG TGG GCC 
lie ser trp ala 

ATC GTT CTT GAG 
lie val leu glu 

AGC TTG TCG CAC 
ser leu ser his 

CGC GCT GGT CGG 
arg ala gly arg 

CGT GGC TGC CGA 
arg gly cys arg 



FIGURE 20C 



sequence Rv3576 oredite oar Cole etal. (Nature 3 ; J > : 1 V — 4 \ ) c^-^a-- ~r.^o~ ' 

1/1 31/11 ' 

atg ggc aag cag eta gec gcg etc gee gcg ctg gtc ggt gcg tgc atg etc gca gee gga 

met gly lys gin leu ala ala leu ala ala leu val glv ala cys net leu ala ala gly* 

61/21 91/31 

tgc ace aac gtg gtc gac gyg acc gec gtg get qz:: ga:: a a a rr.r. gga cca ctg cat cac 

cys thr asn val val asp gly thr ala val ala ala asp I73 aer gly pro leu nis g 1 - 

121/41 151/5: 

gat ccg ata ecg gtt tea gcg ctt gaa ggg ctg c:t ctr gac tt.g age cag ate aat g_ 

asp pre iltj p: 3 val ser ala leu g:u gl y leu ] t- : 1 »>•.: ; ve; lo:i scr gin 1 1 ^ * 5 ~ 

131/51 211/v; 

gcg ~tg ggt gcg aca rrg atg aag gtg tgg tt: a , ; : g-. ;::a ate. tgg ga . trjg ar: 

2^ 1/31 "271/91 

aag age gtg gec aac aag aat tec ctg act ate g :i - •:: e r .1 i C a ; g in aat; gie r,r 

lys ser val ala asp lys asn cys leu ala lie a:e> :;:v ;;rD al.i \ :\ ; v -a" f- 

301/101 331/Ll'l ' 



■i.e 1/ i6i 

; i gr a-/ - g;:a e 1 : gi- : > • ; - 



V f ' t A >. r aV r N I ! R f 



WO 99/09186 



PCT/FR98/01813 



77/185 



OFF d'apres Cole et al . (Nature 393:537-544) et contenant: Rv3576 
1/1 31/11 

taa get tgt cgc aca tgg tgc egg cag gga gga aca qtg ggc aag cag eta gec gcg etc 

OCH ala cys arg thr t rp cys arg gin gly gly thr val gly lys gin leu ala ala leu 
61/21 91/31 

gec gcg ctg gtc ggt gcg tgc atg etc gca gec gga tgc ace aac gtg gtc gac ggg acc 

ala ala leu val gly ala cys met leu ala ala gly cys thr asn val val asp qly thr 
121/41 151/51 

gec gtg get gec gac aad tec gga cca ctg cat cag gat ccg ata ccg gtt tea gcg ctt 

ala val ala ala asp lys ser gly pro leu his gin asp pro ile pro val ser dla leu 
181/61 211/71 

gaa ggg ctg ett etc gac ttg age cag ate aat gec qcq ctg eat gcg ar.< t rn * r- n 

glu gly leu leu leu asp leu ser gin lie asn ala ala leu qly ala thr ser net U's 
24 1/8 1 271/91 

gt? tgg tte aac gee aag gca atg tgg gac tgg i : : aag age gtg gec gac aag aat tgc 

val trp phe asn ala lys ala reet trp asc trn sv: lys ser v;i 1 ala asp lvs a-n — 
301/101 331/111 

ctg get ate ;ac ggt cca gca cag gaa aag gtc tat qcc qae ace ggg tgg acc get atg 

:eu ala ile asp gly pro alii gin glu lys val tyr ala gly thr gly trp thr ala met 
3 61/121 3 91/13 1 

cgc ggc caa egg ctg gat gac age ate gat gac tec aag aaa cgc gac cac tac gec att 

arg gly gin arg leu asp asp ser lie asp asp ser lys lys arg aso his tyr aid ile 
421/141 451/lbl 

caa gcg gtc gtc: ggc tte ccq ace gca cat cat gee gag gag tte tac age tee teg gtq 

gin ala val val gly phe prD thr ala his asi> ala ; T I - gl i: nho tyr s^r s^r se - va 1 
4BI/161 



caa age tgg age age tgc teg aae cgc egg ttt ate gaa gtc a zc ccc cga cag uac gac 
gin ser trp ser ser cys ser asn arg arg P ne val glu val :hr Dro qly gin asn asp 
') 4 1 / 1 n \ ^ '] i / i vj ■ 



gec gee tgg act gtg get gac gtt gtc aa. 



a g t a g 



_ ice t 

ala ala trp thr val ala asp val val 

uj1/2J1 * 

- C VJ :: " * ~ <3<M tgg acc tgc eaq :;t g - • cv c act ..; c ? c ; _ aac aac 

gin glu gly gly asp gly r : r r h r cys qla aij ala lea tar ala arg is:i ac:i 

061/221 6 m •'?.-) 



SrlQ ID N 



c c"\ 



WO 99/09186 



PCT/FR98/01813 



78/185 



1/1 

GTC CTG GTC GCC GCG CAA CTG 
val leu val ala ala gin leu 
61/21 

CGC TGG TAG TGG CGA TGG TGT 
arg trp AMB trp arg trp cys 
121/41 

GCG GCC TGC GGC TGG TGG CCG 
ala aid cys gly trp ser pro 
131/61 

CGG CGC TGG ACG TCG CCG TGC 
arg arg trp thr ser pro cys 
241/81 

AA^ ACT TCA CCG CCC GCA AGT 
lys thr ser pro pro ala ser 
301/101 

CAG ACG TGC GGT CGG GAG TGA 
gin thr cys gly arg gin OFA 
361/121 

TGC TGG CCG AC A GCA TCG GCT 
cys trp pro thr ala ser ala 



31/11 

GCC GGT CCC GAT GGA AAG 
ala gly pro asp gly lys 
91/31 

TAG CAG GAT TGC GGG TCG 
AMB gin asp cys gly ser 
151/51 

CGC GCG CCG AAA TGA TAG 
arg ala pro lys CPA tyr 
211/71 

TGG CCA GCT CGA CCG GAG 
trp pro ala arg pr:> asp 
2 7 1/91 

ACG AGC TGC AG A CGG GAG 
thr ser cys arg arg asp 

331/111 
ACA CGC TGG TGA ACG GCG 
thr arg cys ser thr ala 

TGC GGG ATC 
cys gly lie 

SEQ ID N° 21A 
FIGURE 21A 



TGT TCA CGA TCG CGC TTC TGC 
cys ser arg ser arg phe cys 

AGG CTG CGA TGG CCA GCA CCA 
arg leu arg trp pro ala pro 

CCG CGA TCA CGA AAT ACA TGT 
pro arg ser arg ajn thr cys 

ACG ATG TGG AGG GGG CGC AGA 
thr ir.eu trp arg gly arg arg 

TGG CGG ACA CGG ACG TCA TCG 
trp pro thr pro thr ser ser 

GTC AGG CGC TGG TGG ATA AGA 
val arg arg cys trp ile arg 



32/ 1 L 

TCG TGj TGG GGG GGC AAG TGG CGG GTC CGG AT G GAA AGT GTT GAG GAT CGG GCT TGT GC.r 

ser trp ser pro arg asp. trp pro val pro rr.et giu ser val hi:: asp arc; ala s-r a'a 

62/2 1 G2/.3L " 

GGT GGT AGT GGC GAT GGG GTT AGC A j G ATT G G G GGT TGA GGC TG G GAT GGC CAG G A G GAG 

ala gly ser 3 ly asp 1 y val ser arg lie a. a gly a::; gly ,y., , t si) r; 1 y r, l r 

i y :> / 4 i i z- n / - - ' J " ^ " 



WO 99/09186 



PCT/FR98/01813 



79/185 



CCT GGT CGC CGC GCA ACT GGC CGG TCC CGA 
pro gly arg arg ala thr gly arg ser arg 
63/21 

CTG GTA GTG GCG ATG GTG TTA GCA GGA TTG 
leu val val ala met val leu ala gly leu 
123/41 

GGC CTG CGG CTG GTC GCC GCG CGC CCC GAA 
gly leu arg leu val ala ala arg ala glu 
1R3/C1 

GCG CTG GAC GTC GCC GTG CTG GCC AGC TCG 
ala leu asp val ala val leu ala ser ser 
243/81 

AAC TTC ACC GCC CGC AAG TAC GAG CT 3 C?G 
asn phe thr ala arg lys tyr glu leu gin 
303/101 

GAC GTG CGG TCG SGA GTG AAC ACG CTG CTC 
asp val an ser gly val asn thr leu leu 
363/121 

CTG GCC GAC AGC ATC GGC TTG CGG GAT C 
leu ala asp ser lie gly leu arg asp 



33/11 

TGG AAA GTG TTC ACG ATC GCG CTT CTG CCG 

trp lys val phe thr ile ala leu leu pro 
93/31 

CGG GTC GAG GCT GCG ATG GCC AGC ACC AGC 

arg val glu ala ala met ala ser thr ser 
153/51 

ATG ATA CCC CCG ATC ACG AAA TAC ATG TCG 

met lie pro ala ile thr lys tyr met ser 
213/71 

ACC. GGA GAC GAT GTG GAG GGG GCG CAG AAA 

thr gly his asp val glu gly ala gin lys 
273/31 

ACG CGA CTC CCT ("AT ACT hat GTC ATC CCA 

thr ar;; leu ala asp thr asp val ile ala 

aa:; g:;c ggt cag gcg ctg ctg gat aag atg 

— = r - 7 ~ V ~ly ^ r- ala leu leu asp lys rner 



SEQ ID N'° 21C 
FIGURE 21C 



WO 99/09186 



PCT/FR98/01813 



80/185 



1/1 

CGA TCG CGC TTC TGC CGC 
arg ser arg phe cys arg 
61/21 

CGA TGG CCA GCA CCA GCG 
arg trp pro ala pro ala 
121/41 

TCA CGA AAT AC A TGT CGG 
ser arg asn thr cys arg 
181/61 

TGG AGG GGG CGC AGA AAA 
trp arg gly arg arg lys 
241/81 

ACA CCG ACG TCA TCG CAG 
thr pro thr ser scr gin 
301/101 

CGI TGC TGG ATA AGA TGC 
ij: 3 cys Lrp i 1 ^ arg rvs 



31/11 

TGG TAG TGG CGA TGG TGT TAG 
trp AMB trp arg trp cys AMB 
91/31 

GCC TGC GGC TGG TCG CCG CGC 
ala cys gly trp ser pro arg 
151/51 

CGC TGG ACG TCG CCG TGC TGG 
arg trp thr ser pro cys trp 
211/71 

ACT TCA CCG CCC GCA AGT ACG 
thr ser pro pzj ala ser thr 

::7:/9i 

A^G TGC GGT CGG GAG TGA ACA 

thr cys gly arg qlu OPA thr 
:< 3 1 / 1 1 1 

TGG CCG ACA GCA TCG GCT TGC 

trp pro t h r a 1 a i- e r a 1 a c y s 



SEQ ID N° 21B* 
FIGURE 21B* 



CAG GAT TGC GGG TCG AGG CTG 
gin asp cys gly ser arg leu 

GCG CCG AAA TGA TAC CCG CGA 
aid pro lys OPA tyr pro arg 

C2A GCT CGA CCG GAZ ACG ATG 
pro aia ary pro asp thr ;net 

AGC TGC AGA CGC GAG TGG CCG 
ser cys arg arg asp trp pro 

CGC TGC TCA ACG GCG GTC AGG 
arg cys ser thr ala val arg 

giv ilo 
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sequence Rv3365c predite par Cole et al . (Nature 393:537- 5-14) et contenant 
Seq2lA* 

1/1 31/11 

gtg acc atg ttc gcc cgc ccg acc ate ccg gtc gcg gcg gec get tct gat att tec gec 

val thr met phe ala arg pro thr ile pro val ala ala ala ala ser asp ile ser ala 
61/21 91/31 

ccg get caa ccg gcc cgc ggc aaa cct cag caa cqc ccq ccg tec tqg teg ccg cgc aac 

pro ala gin pro ala arg gly lys pro gin gin arg pro pro ser trp ser pro arq asn 
321/41 l 5 ]/5] 

tgg ccg gtc cga t.gg aaa gtg ttc acg ate gcg ctt ctg ccg ctg gta gtg gcg atg gtg 

trp pro val arg trp lys val phe thr ile ala leu leu pro leu vai val ala met val 
181/61 211/71 

tta gca gga ttg egg gtc gag get gcg atg gee age acc age qqc ctq ego erg gr- c gcc 

leu aid yly leu arg val glu a±a ala met ala scr thr ser gly leu arq leu val Ila 
241/81 271/91 

gcg cgc gcc gaa atg ata ccc gcg at:; ac; aa=i tae atg teg gcg ctg gar gtc gec gtg 

ala arg ala glu net ile pro ala ile thr lys t.yr m-r set: ala leu asp val lia vai" 
301/101 331/111 

ctg gec age teg ace gga eac gat gtq gag ggg gcq caq a^a aac ttc acc gec cgc aay 

leu ala ser ser thr gly his asp val glu qly ala qln lys asn phe thr ala arq lys 
3 61/121 391/131 " 

tae gag ctg cag acg cga ctg gcc ga: acz gae gtc ate qca gac gtg egg t=g gga gtg 

tyr glu leu gin thr arg leu ala asp thr asp val ile ala asp val arg ser gly val 
421/141 451/151 

aac acg ctg etc aac ggc ggt cag gcg ctj ctg gat aag gtg ctg gee gac age ate ggc * ■ 

asn thr leu leu asn yly gly g]» ala leu leu asp lys val leu ala asp ser lie gly 
■181/101 ^ 11/' 17 1 

ttg egg gat egg gtc acc gcc tae gcg ccg ctg ctg ttq acq gcc cag aac gtg att gar 

leu arg asp arg val thr ala tyr ala pr) leu leu leu thr ala gin asn vai asn 
Ml/lfil 571/19; 

gcg teg gtg egg gtt gac age gag caa at.: cga a - : car; gt: 

ala ser va. arg val asp ser glu gin il-t arg th: qln va ' 

*i)01/20i ' o?l/211 

gtt ggc ccc cgc qgg cag atg acg atg ca 7 gai at- : 



. g g g 1 1 1 -j age c y z 



g. y a . a 
361/221 



- ' - ^ • = ~7 " ■ ' : age q.: ; 

1 Q * - P r - q 1 : . >u arq se r ala 

■;: : !2\ : 
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1021/341 1051/351 

cgc acq ctg gtc ggg ccg atg egg gta ctg cgt gat ggg gcg etc aag gtt get cat acc 

arg thr leu val gly pro met arg val leu arg asp gly ala leu lys val ala his thr 
1081/361 1111/371 

gat etc gac ggc gag ate gcg gcg gtc cgc gec ggc gac gag ccg ate ccc gag cca ctg 

asp leu asp gly glu ile ala ala val arg ala gly asp glu pro ile pro qlu pro leu 
1141/381 1171/391 

gcg gtg tac acc acc gag gaa ate ggt cag gtc gcg cat gcg qtc gac gag ctg cac acc 

ala val tyr thr thr glu glu ile gly gin val ala his ala val asp glu leu his th- 
1201/401 1231/411 

egg gec ctg ttg ctg gec ggc gag gaa acg egg tty cga clg ctg gtc aac gag atg ttt 

arg ala leu leu leu ala gly glu glu thr arg leu arg leu leu val asn qlu rre- nhe 
1261/421 1291/431 

gag acc atg teg egg cgt age cgt tec ctg gtc gac cag cag ctg teg gtc ate gac caa 

glu thr met sc: arg arg ser arg set leu val asn gin gin leu ser val ile aso qln 
1321/4-11 1351/451 ' 9 

ctg gag cgc aac gag gag gat ccc gec cgi etc gac age ctt ttc egg etc gar ca- 

leu glu arg asn glu glu asp pro ala arg leu asp ser leu phe arg leu aso his leu 
1381/461 1411/471 

gec gec egg ctg cgc cgc aac age gee aac erg ctg gtg ctg gec ggt gcg cag att acc 

ala ala arg leu arg arg asn ser ala asn leu leu val leu ala gly a^a qln ile <-hr 
1441/481 1471/491 

cgt gac cac cgc gag ccg gtg ccg ctg tea acc gtg ate age gee gec gtg tea gag gtc 

arg asp his arg glu pro vai pro leu ser thr val ile ser ala ala val ser qlu val 
1501/501 1531/511 

gag qac tat cgc cgc gtc gac ate gcg agg gta ccc gac tgt gcg gta gtc ggc gca gcg 

glu asp tyr arg arg val asp lie ala arg val pro aso cvs ala vai val qly ala al f - 
1561/521 1591/531 

get ggt ggc g — att car ctg ctt ccc gag ctg ate gac aac gcg ttg cgc tac teg tea 



val ile his leu leu ala glu leu 

1621/54 



asp a s r. a x a i e u arg tyr ser ser 



_ l> :> l ,' j j 

CCq ac:: :ica zzz = ! 3 tt: S c = 9 = * < 3 — gs = * 3 z gaa ggc agt gtt ctg c* g <eqa 

pre> thr t h r p : o va 1 a r g va 1 ala a 1 i a i a 1 1 e u 1 ; 
16 31/561 ' ' 1 7 : 1 ' 5 ■ 
ate teg gar t:: gg„ — : .; g : atg ,r.:;: gar gec ga- 
ll e ser asp s e r g 1 y 1 e u g 1 y mo r t h : a s p a 1 ^ a s : 
1 ' ■' I ■ / 5 r I i / e - 



ser vat 



;cc aat 



a i u a : g e' e t ala asn :-*■» t arg 



ga...j era rac 
glu • > ' ' y r 



( 
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2041/681 

cgc cgt acc ccg ggg tec 
arg arg thr pro gly ser 
2101/701 

egg cgc gag ctg aaa aca 
arg arg glu leu lys thr 
2161/721 

ccc gca cca gaa ccg cga 
pro ala pro glu pro arg 
2221/741 

gtt gat gac gac gtc ate 
val asp asp asp val lie 
2281/761 

ctg gec cac age ccc gat 
leu ala his ser pro asp 
2341/781 

:;cc gag gec gcg gar aag 
ala glu ala ala asp lys 
2 4 01/801 

ccc ggg gec egg tta gtg 
rro gly ala arg leu val 
2461/821 

ggt gca gcg eta gca tec 
gly ala ala leu ala scr 
2521/841 

gcg gta cgc gac ccc gac 
ala val arg a s p pro asp 
256 1/861 

acc ggg egg teg cat qec 
thr gly arg s e r hi r, a 1 a 



2071/691 
age ggc ate gec gac gtc ccg 
ser gly ile ala asp val pro 

2131/711 
ccc tgg tgg gag gat agg ttt 
pro trp trp glu asp arg phe 

2191/731* 
ccg gcg ccg ccg ccc jr.c aaa 
pro ala pro pro pro ala 1 v s 

2251 ' 751 
tac egg egg atg etc tec gag 
tyr arg arg net leu ser glu 

2 311 ' 7 7 1 " 
ctg gac tgg aag teg jtg tgg 
leu asp trp lys ser val t rn 

:. 3 7 i - 7 y i 

ccc gtg cag tec c:;s ,^-g gac 
pro va 1. qln s e r a : g vhr as n 

2 4 3 1 ' 9 : 1 
ccg ggg qcg gcg gtg ccc -ag 
pro gly ala ala v a 1 p r o q I u 

2 4 9 1 .' li 3 1 
aac ggc gga ctt cat ccc ggc 
asr. gly gly leu h : s pro gly 

: 551/851 
gcg gtt cgt gec tec ate age 
ala val arg ala ser :le ser 



cgc gag age aqt 



gee cag ccg atg cag cag egg 
ala gin pro met gin gin arg 

caa cag gag ccc aaa caa ccg 
gin gin glu pro lys gin pro 

ccc gcg cca ccg gcg ggc ccg 
p:o ala pro pro ala gly pro 

atg gtg ggt gac ccg cac gag 
met val gly asp pro his glu 

gac cac ggc tgg teg gcg gec 
asp his gly tip ser ala ala 

tac ggc ctg ccq qtg cgc gaa 
tyr gly leu pro val arg glu 

gea ccc qat egg gag cat ccg 
gly pro asp arg glu h:s pro 

"ga gcg ccq egg cac gcg get 
arc; ala pro arg his ala ala 

age eat ttc ggc ggc gtg cgc 
s..-: :.:s one gly qly val arg 

i ; " sag ca i r ga 



SEQ ID N 2 21 P (suite) 
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ORF d'apres par Cole et al. (Nature 
1/1 

taa ggg tgc ggc egg tgg cac ggc cgc 
OCH gly cys gly arg trp his gl y arg 
61/21 

ccg gtc gcg gcg gec get tct gat att 
pro val aia ala aia ala ser asp ile 
121/41 

cag caa cgc ccg ccg tec tgg teg ccg 
gin gin arg pro pro ser trp ser pro 
131/61 

ate gcg cLL ct.g ccg ctg gta gtg gcg 
He ala leu leu pro leu val val ala 
241/81 

atg gec age acc age ggc ctg cg^ ~tg 
net ala ser t.hr ser gly leu arj leu 
jOI/101 

a eg aaa tac atg teg gcg ctg ga jtc 
thr lys tyr met: ser ala leu aso val 
361/121 

gag ggg gcg cag aaa aac ttc ac: gee 
glu gly ala gin lys asn phe thr ala 
421/141 

acc gac gtc ate gca gac gtg egg teg 
thr asp val ile ala a so val arq :;er 
481/161 

ctg ctg gat dag gtg ctg gec gac age 
leu leu asp ly:> val leu ala asp sor 
54 1/161 



393:537-544) et cont.ennant Rv3365c 
31/11 

ggc cac gtg acc atg ttc gee cgc ccg acc ate 

gly his val thr met phe ala arg pro thr ile 
91/31 

tec gec ccg get caa ccg gec cgc ggc aaa cct 

ser ala pro ala gin d;o ala arg gly lys p^o 
151/51 

cgc aac tgg ccg gtc cga tgg aaa gtg ttc acg 

arg asn trp pro val arg trp lvs val phe thr 
211/71 

atg y t g 1 1 a a c a ci a a rrn r-nn „ <- « ^ . . 

.. .. J - -j , ^ - - ^ - - 

net val leu ala gly leu arg val glu ala ala. 

271/91 

gtc -jcc gcg cgc gec gaa atg ata ccc gcg ate 

val 1 1 a ala a r g a la glu me t lie pro ala i 1 e 
331/111 

gec gtg ctg gec age: teg acc gga cac gat gtg 

ala val lew ala ser ser thr gly his aso va> 
391/13: 

cgc iag tar: gag ctg cag acg c:ja ctg gec gac 

arg lys tyr glu lou gin thr arg leu ala <asp 
451/151 

gga gtg ^r. a-g etc etc aac ggc ggt cag gcg 

3 iv ar>:\ thr 1-u 1-u as- gly gly gin ala 

a ; :: '!9 C ttg egg gat. egg gtc acc gec tac gcg 
l] " ir ; --i-r val thr ala tyr ala 
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901/301 

gac att gcc gag cag 
asp ile ala glu gin 
961/321 

cag gcc acc gac egg 
gin ala thr asp arg 
1021/341 

gcg acc gcg ate gtc 
ala thr ala ile. val 
1081/361 

ctg cgt gat ggg gcg 
leu arg asp gly ala 
1141/381 

cgc gcc ggc gac gag 
arg ala gly asp glu 
1201/401 

cag gtc gcg cat gcg 
qln val ala his ala 
1261/421 

acq egg ttg cga ctg 
thr arg leu arg lei; 
1321/441 

ctg gtc gac cag cag 
leu val asp gin gin 
1381/461 

cga etc gac age; c 1 1 
arg leu asp sou leu 
1441/481 

aac ctg ctg gtg ctg 
asn leu leu val leu 
1501/501 

tea acc gtr; ^r..; age 
5 c: t h r va 1 : 1 e s e r 
15 61/521 



gtg ate acc gac acc 
val ile thr asp thr 

egg gat gcc gcg att 
arg asp ala ala ile 

gtc gtg ttg gtg gtg 
val val leu val v<-al 

etc aag gtt get cat 
leu iys vdl ala his 

ccg ate ccc gag cca 
pro ile pro glu pro 

gtc: gac gag ctg cac 
val asp glu leu his 

ctg gtc aac gag atg 
1 e u va 1 a s n glu me t 

ctg teg gtc ate gac 
leu ser val ile asp 

ttc egg etc gat cac 
ph e arg ieu asp his 

gcc ggc qcg cig att 
ala gly ala gin 1 1 e 

gcc g:.: T- < ■ " * J • J 
ala ala val set glu 



931/311 

acc gag gcg gtg acg 
thr glu ala val thr 
991/331 

cgc gac gcc gtg ctg 
arg asp ala val leu 
1051/351 

gcg cgc acg ctg gtc 
ala arg thr leu val 
1111/371 

acc gat etc gac ggc 
thr asp leu asp gly 
1171 / 391 

ctg gcg gtg tac acc 
leu ala val tyr thr 
1231 '411 

acc zq^ gee ctg ttg 
thr arg ala leu leu 
1291/4 3 1 

ttt gag acc atg teg 
p he glu t h r r.et s e r 
1 3 b 1 / 4 5 1 

caa ctg gag cgc aac 
gin ieu glu arg asn 
1411/471 

ct.g gcc gcc cgq ctg 
leu ala ala arg leu 

1471/4 -r. 

acc cgt. c • cac cgc 
thr arq asp his arg 
1 ^ 3 1 .' 5 1 1 




aag teg gtg caa age 
lys ser val gin ser 

gtg ttg gcc gcc ate 
val leu ala ala ile 

ggg ccg atg egg gta 
gly pro met a rg \ al 

gag ate gcg gcg gtc 
glu ile ala ala val 

acc gag gaa ate ggt 
thr glu glu ile gly 

ctg gcc ggc gag gaa 
leu ala gly glu glu 

egg cgt age cgt tec 
arq arg ser arg ser 

gag gag gat ccc gcc 
glu glu asp pr^ala 

cgc cgc aac age gcc 
arg arg asn ser ala 

gac; ccg gtg ccg ctg 
glu pre val pre leu 

cgc gtc gac ate arc 
arg v i 1 asp 1 1 v ala 
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1861/621 

gtc ggg ctg cgc ggt 
val gly leu arg gly 
1921/641 

ctg ccg eta gcc gtg 
leu pro leu ala val 
1981/661 

gcg ate aag ccg ccg 
ala ile lys pro pro 
7 0 41/631 

ate ggg ccg ctd cca 
lie gly pro leu pro 
2101/701 

gcc gac gtc ccj gcc 
ala asp va 1 p ro ala 
2161/721 

gag gat agg ttt :aa 
glu asp arg phe gin 
2221/741 

ccg ccr. gcc aa.i ccc 
pro pro ala lys pro 
2261/761 

atg etc tec gag atg 
net leu ser glu met 
2341/781 

aag teg gtg tgg gac 
lys ser val trp asp 
2 4 01/801 

tec cgc a eg gac tac 
ser arg t h r asp t y r 
2461/321 

gcg gtg ce\. g v; gga 
ala val p- -1. aly 
2 521/84; 

ctt car c:c ggc cga 

2;-.-: LLL 



ccg gtg acc ggt gaa 
pro val thr gly glu 

etc gag ggg acg gcc 
leu glu gly thr ala 

tgt cct gaa ccc gcg 
cys pro glu pro ala 

ccg gtc a eg ttg etc 
oro val thr leu leu 

cag ccj atg cag cag 
gin pro met gin gin 

cag gacj cec aaa caa 
gin glu pre lys gin 

jcg cca eccj gcg ggc 
ala pro pic ala gly 

gtg ggt gac ccg cat 
val gly asp pro his 

■cue gg : tgg teg gcg 
his gly trp ser a La 

5 gc ctg ccg gtg cgc 
g 2 y leu pro val a r 

- - - gat o : g a g c n t 
pro a op arg glu h :. > 

gcg c c g egg c a e g c g 
i!i rr" > : : h: '< Li 



1891/631 

cag ggc acc ggc acc 
gin gly thr gly thr 
1951/651 

cca gcg cag ccg cca 
pro ala gin pro pro 
2011/671 

gcg gee ,gar ccg acg 
ala ala asp pro thr 
2071/691 

ccg cgc cgt acc ccg 
pro i r ;t 3 thr or:: 
2131/711 

egg egg cgc gag ctg 
arg arg arg glu leu 

2 191/731 

ccg : e c g c a cca gaa 
pro pro ala pro glu 
2 2b l/7ol 

ccg gtt gat gac gac 
pro val asp asp asp 
2311/771 

gag ctg gcc cac age 
glu leu ala his ser 

2 37L/791 

gcc gcc gag gee gcg 
a 1 . i la glu a 1 a a 1 a 
: .' 4 3 1 '31 1 

::a 1 : ~ : -igg -=gg 

clc pro gly a^a arg 
2 4 91 ' y 3 1 

• •' JL r-"i .; • : cca 
: :L; ' . ; 

'•' ~ ; :: : eta c to gac 



acc 
thr 


gcc 
aid 


gag 

glu 


gtc 
va 1 


tac 
tyr 


aag 
lys 


ccg 
pro 


egg 
a rg 


gta 
val 


ttt 
phe 


gac 
asp 


gtt 
val 


ccc 
pro 


gcc 
ala 


gcc 
ala 


ggg 

gly 


tec 


agt 
s e i. 


ggc 

yiy 


ate 
lie 


aaa 

1 ys 


aca 
thr 


ccc 
pro 


tgg 
trp 


tgg 
t ro 


ccg 
pro 


cga 
arg 


ccg 
o r 'O 


gcg 
a la 


c e g 
o r o 


gtc 
val 


ate 
lie 


ta e 
tyr 


egg 
arg 


egg 
arg 


ccc 
pro 


gat 
asp 


ctg 
leu 


ga c 
asp 


:gg 


gac 
a sp 


aag 
lys 


cce 
p ro 


gtg 
va 1 


cag 
gin 


1 1 a 


gtg 
val 


ccg 
p ro 


ggg 
g 1j y 


a I -': 


g>w 




a a c 

n ;~ p 


g g o 


gg. t 






o, eg 
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CTA CGA 


CAA 


GGC 


AAA 


GGA 


GCA 


leu arg 


gin 


gly 


lys 


gly 


ala 


61/21 












CGC CAT 


TCT 


GGT 


CGC 


AGG 


TCT 


arg his 


ser 


gly 


arg 


arg 


ser 


121/41 












TGA GAC 


CAC 


GAC 


CGC 


GGC 


AGG 


0?A asp 


his 


asp 


arg 


gly 


arg 


131/61 












CGT CAT 


CGA 


CGG 


TAA 


GGA 


CCA 


arg his 


arg 


arq 


OCH 


gly 


pro 


241/81 












CAA TflT 


r a a 


CAT 


CGC 


■-in t 




gin cys 


gla 


hi 5 


ar; 




arg 


301/101 












CAA CCC 


TCC 


GGA 


uGT 


GAA 


GTC 


gin pro 


ser 




■?iy 


glu 


va 1 


361/121 












CAC GTC 


GGG 


cac 


CGG 


ACA 


GGG 


his val 


gly 


his 


arg 


thr 


gly 



31/11 

CAG GGT GAA GCG T^G ACT 
gin gly glu ala trp thr 
91/31 

TTC CGG ATG TTC AAG CAA 
phe arg met phe lys gin 
151/51 

CAC GAC GGC AAG CCC CGG 
his asp gly lys pro arg 

2 11/ 

GAA CGT CAC CGG GTC TGT 
glu arg his a r :j va 3 cys 

271/-V 

ar ? gly gly asp a; :; his 

r J i / : : : 

CGT TGG GCT CGG TAA CGT 
arg trp ala a r i " [ h arg 

m .' . :• : 

i AA I l-G !j _A 1 AAG 

OCH arg ^r a.l a ' : ; 1 •/;; 



GAC GGT CGC GGT AGC CGG AGC 
asp gly arg gly ser arg ser 

CAA GTC GAC TAC AGG AAG CGG 
gin val asp tyr arg lys arg 

CGC CGC ATC CGG GCC GAA GCT 
arg arg lie arg ala glu gly 

:;GT GTG CAC AAC CGC GGC CGG 
gly val his asn arg gly arq 

CGC ^oC CGT GCT CAC CGA CGG 
cys irq arg ala his arg arg 

CAA CGG CGT CAC GCT GGG ATA 
g 1 : : a r g arg his a 1 a g I y 1 ? 

CAC GGC AGC CAC TAC AAG ATC 
i: >Y g-y ser his tyr lys :le 



S^Q ID N° 22A 
FIGURE: 22A 
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ACG ACA AGG CAA AGG AGC 
thr thr arg gin arg ser 
63/21 

CCA TTC TGG TCG CAG GTC 
pro phe trp ser gin val 
123/41 

AGA CCA CGA CCG CGG CAG 
arg pro arg pro arg gin 
1S3/61 

TCA TCG ACG GTA AGG ACC 
ser ser thr val arq thr 
243/8L 

ATG T:A ACA TCG CGA TCG 
me t s e, l thr s e r dry ser 
3 0 3/ 101 

ACC CTC CCG ACC TGA AGT 
thr leu arg arg OPA ser 
363/12: 

CGT C^G G3A CCG GAC AGG 
arg arg a la pro asp arg 



33/1 ; 

ACA GGG TGA AGC GTG GAC TGA 
thr gly OPA ser val asp OPA 
93/31 

TTT CCG GAT GTT CAA GCA ACA 
phe pro asp val gin ala thr 
153/51 

GCA CGA CGG CAA GCC CCG GCG 
ala arg arg gin ala pro ala 
213/71 

AGA ACG TCA CCG GGT CTG TGG 
arq thr jor pro gly lea trp 

273/91 

GCG GGG CGG CGA CCG GCA TTG 
ala gly arg arg pro ala leu 
3 33/11 1 

CCG TTG GGC TCG GTA ACG TCA 
pro leu gly ser val thr ser 

3 j 3 / 1 3 1 

GTA ACG CTC GGC AAC CAA G G A 
val thr 1-u yly t ::;n gin gj v 

SEQ ID N & 22C 
FIGURE 22C 



CGG TCG CGG TAG CCG GAG CCG 
arg ser arg AMB pro glu pro 

AGT CGA CTA CAG GAA GCG GTG 
ser arg leu gin glu ala val 

CCG CAT CCG GGC CGA AGG TCG 
pro his pro gly arg arg ser 

TGT GCA CAA CCG CGG CCG GCA 
cys aid gin pro dry pro a J ( -i 

CCG CCG TGC TCA CCG ACG GCA 
pro pro cys ser pro thr ala 

ACG GCG TCA CGC TGG GAT ACA 
thr ala ser arg trp asp thr 

CGG CAG CCA CTA CAA CAT C 
arg gin pro leu gin asp 



GCA CAA CCG CGG CCG GCA ATG TCA ACA TCG %" GA 7 

ala a In pro arg pro ala rr.et s^r thr i-- - 

tit 2 :.. 

CCG To'l TCA CCG ACG GCA ACC CTC CGG AG ~ TGA A 

pro cys ier pro thr ala thr leu arg ary G:CA 5 

12 1/41 



trp asp :hr a ry arq a. a r : 



a i a ser .1 
131/cl 

GCA GCC A-T ACA AGA TCA CAG G GT 
■ a all th : a :. j se : y 1 n y 1 y 



Co CGG CGA. CCG GCA T'l'G CCG 

. y a : y a rg prn ala lea pre 

:g gc; tcg GTA ACG TCA ACG 

■' - g l y •■ r- r val thr e ; thr 

■ - ■' CAA CCA A.GG A .C^ 



f - V--: Act: ML \ I }R£ l..c : 2b 



WO 99/09186 



PCT/FR98/01813 



89/185 



CAC AAC CGC GGC CGG 
his asn arg gly arg 
62/21 

CGT GCT CAC CGA CGG 
arg ala his arg arg 
122/41 

CGT CAC GCT GGG ATA 
arg his ala gly ile 
182/61 

CAG CCA CTA CAA GAT 
gin pro leu gin asp 
242/81 

ile lc; val ala gly 
302/101 

ACC ACG ACC GCG GCA 
thr thr th: ala ala 
352/ 12 1 

TCG ACG GTA AGG ACC 
ser thr val arg tnr 
422/141 

TCA A^A TCG CGA TCG 
ser thr ser arg ser 
482/161 

CTC CGG AGG TGA AGT 
leu arg arg OPA ser 
542/131 

CGG GCA CCG GAC AGG 
a r q ala rr^ asp a r g 



CAA TGT CAA CAT CGC 
gin cys gin his arg 

CAA CCC TCC GGA GGT 
gin pro ser gly gly 

CAC GTC GGG CAC CGG 
hi 5 val gly has arg 

CAC AG 3 GTG AAG CGT 
his arg val iys arq 



'vl * 1^ .. oGA T(;: TAA 
leu ser gly cys ser 

GGC ACG ACG GCA ACC 
gly thr :nr ala sor 

ACA ACG TCA CCG GCT 
arg thr ser pro ala 

CCG GGG CGG CGA CCG 
ala gly arg arg pro 

^CG TTG GGC TCG GTA 
pro leu gly ser val 

^ FA ACG CCT CGC CAA 



32/11 

GAT CGG CGG GGC GGC 
asp arg arg gly gly 
92/31 

GAA GTC CGT TGG GCT 
glu val arg trp ala 
152/51 

AC A GGG TAA CCC CTC 
thr gly OCH arg leu 

:i2/";i 

GGA CTG AC G GTC GCG 
gly leu thr vii ala 
272/91 

AG C A/AC AAG TCG ACT 
se: dsn 1 y.s n?r thr 
332/111 

CC\* GGC GCC GCT CCG 
p r g 1 y ala ala p r o 
3 9 ^ / 1 3 1 

CCC TGG TGT GCA CAA 
► : - t-P cys ala jin 
452/151 

GCA TTG CCG CCG TGC 
ala leu pro pro cys 
512/17 1 

ACG TCA ACG GCG TCA 
thr s e r thr ala ser 
5 7 2 /' 1 9 1 



GAC CGG CAT TGC CGC 
asp arg his cys arg 

CGG TAA CGT CAA CGG 
arg OCH arg gin arg 

GGC AAC CAA GGA CGG 
gly asn gin gly arg 

GTA GCC GGA GCC GCC 
val ala gly ala ala 

ACA GGA ACC GGT GAG 
tar gly ser gly gl u 

GGC CGA AGG TCG TCA 
gly arg arg ser s-r 

CCC CG j CCG 3CA ATG 
pro arg pro :ila rr.et 

TCA CCG ACG GCA ACC 
ser pro thr ala- thr 

CGC TGC1 GAT ACA CGT 
arg trp asp thr arg 

r.Z . ACA AGA '1C 
thr thr a:- 



SEQ ID N° 2 3; 



WO 99/09186 



90/185 



PCT/FR98/01813 



ACA ACC GCG GCC GGC 
thr thr ala ala gly 
63/21 

GTG CTC ACC GAC GGC 
val leu thr asp gly 
123/41 

GTC ACG CTG GGA TAC 
val thr If. u gly tyr 
183/61 

AGC CAC TAC AAG ATC 
ser his tyr lys lie 



TTC TGG TOG CAG GTC 

phe trp ser gin val 
303/101 

CCA CGA CCG CGG CAG 

pro arg pro arg gin 
363/121 

CGA CGG TAA GGA CCA 

arg arg OCH gly pro 
423/1-11 

CAA CAT CGC GAT CGG 

gin his arg asp arg 
403/161 

TCC GGA GGT GA*\ GTC 

ser gly gly glu val 
543/181 

o'^iG C.»-\v_ l — j _t ,>\Cn GGG 

gly his di g t h r gly 



AAT GTC AAC ATC GCG 
asn val asn ile ala 

AAC CCT CCG GAG GTG 
asn pro pro glu val 

ACG TCG GGC ACC GGA 
tar se: gly thr gly 

ACA GGG TGA AGC GTG 
thr gly OPA ser val 

TTT CCG GAT GTT CAA 
phe pro asp val gin 

GCA CGA CGG CAA GCC 
ala arg arg gin ala 

GAA CGT CAC CGG CTC 
glu aLy his ar'j leu 

CGG GGC GGC GAC CGG 
arg gly gly asp arg 

CGT i GG jCT CG ; . ! TAA 
arg trp sia arg OCH 

TAA CGC CTC GGC AAC 
OCH ar:; lou gly asn 



33/11 

ATC GGC GGG GCG GCG 
ile gly gly ala ala 
93/31 

AAG TCC GTT GGG CTC 
lys ser val gly leu 
153/51 

CAG GGT AAC GCC TCG 
gin gly asn ala ser 
213/7 1 

GAC TGA CGG TCG CGG 
asp OPA arg ser arg 
273/91 

GCA ACA AGT CGA CTA 
ala thr ser arg leu 
333/111 

CCG GCG CCG CTC CGG 
pro ala prD leu arg 
393/131 

CGT GGT CTC CAC AAC 
arg gly val his asn 
4 5 3/15 1 

CAT TGC CGC CGT GCT 
his cys arg arg aid 

513/17: 

: - ^ T CAA C G G CGT C A C 
dig gin arg arg his 

57:/ 13: 

gir. giy arg gin pre. 



ACC GGC ATT GCC GCC 
thr gly ile ala ala 

GGT AAC GTC AAC GGC 
gly asn val asn yly 

GCA ACC AAG GAC GGC 
ala thr lys asp gly 

TAG CCG CAG CCG CCA 
AMB Dro alii r^ rr , 

CAG GAA GCG GTG AG A 
gin glu ala val arg 

GCC GAA GGT CGT CAT 
ala glu gly arg his 

3GC GGC CGG CAA TGT 
irg gly arg gin C ys 

CAC CGA CGG CAA CCC 
his arg arg gin £ro 

GCT 'jGG ATA CAC GTC 
ala giy il G his val 

CTA CAA GAT C 
leu gin a.sp 



SKQ ID yr 2 3C 
FT GUP. -J 2 3C 



WO 99/09186 



PCT/FR98/01813 



91/185 



CTA ACG ACA GGC AAA GGA 
leu thr thr gly lys gly 
61/21 

CGC CAT TCT GGT CGC AGG 
arg his ser gly arg arg 
121/41 

TGA GAC CAC GAC CGC GGC 
OPA asp his asp arg gly 
181/61 

CTC ATC GAC GGT AAC GAC 
val ile asp gly lys asp 

2 41/81 

AAT GTC AAC ATC GCG ATC 
asn v: 1 asn lit: did lie 
301/1C1 

AAC CCT CCG GAG GTG AAG 
a 5 n pro pre gi u va i 1 vs 

3 61/121 

ACG TC3 GGC ACC GGA CAG 
thr ser gly thr gly qlr; 



31/11 

GCA CAG GGT GAA GCG TGG ACT 
ala gin gly glu ala trp thr 
91/31 

TCT TTC CGG ATG TTC AAG CAA 
ser phe arg met phe lys gin 
151/01 

AGG CAC GAC GGC AAG CCC CGG 
arg his asp gly lys pro arg 
211/71 

CAG /-AC GTC ACC GGC TCC GTG 
gin asn val thr gly se: val 

2 7 1/91 

GGL GGG GCG GCG ACC' GGC ATT 
gly :ji y ala ala thr giv : le 

3 3 1 / I ■ 1 

TCC GTT GGG CTC GGT AAC GTC 
ser val gly lev; q 1 y a s r: v a 1 
3 9 1/13 1 

GGT AAC GCC TCG GCA ACC AAG 
gly asn ala ser. ala thr Ivs 



GAC GGT CGC GGT AGC CGG ACC 
asp gly arg gly ser arg ser 

CAA GTC GAC TAC AGG AAG CGG 
gin val asp tyr arg lys arg 

CGC CGC TCC GGG CCG AAG GTC 
arg arg ser gly pro lys val 

GTG TGC ACA ACC GCG GCC GGC 
val cys thr thr ala ala gly 

GCC GCC GTG rrr prr GGC 
ala ala val leu thr asp gly 

AAC GGC GTC ACG CTG GGA TAC 
as:; gl y val thr leu gly tyr 

GAC GCC AGC CAC TAC AAG ATC 
a s p - 1 y ser his tyr 1 y s i 1 e 



SEQ ID N° 24A 

FIGURE 24A 



WO 99/09186 



PCT/FR98/01813 



92/185 



AAC GAC 
a s n asp 
63/21 
CCA TTC 
pro phe 
123/41 
AG A CCA 
arq pro 
183/61 
CAT CGA 
h : r, a r g 
243/01 
i'oi' CAA 
eye glr; 

in:-/] s: 



AGG 
a rg 



TGG 
tro 



CGA 
arg 



CGC 

arc. 



hi 2 



CAA AGG 
gin arg 

TCG CAG 
ser gin 

CCG CGG 
pro arg 

TAA GGA* 
OCH gly 

CGC GAT 
a r g a s p 

G G T GAA 



ser 

GTC 
va 1 

CAG 
gin 

CCA 



arq 



GT C 
va : 



AC A 
thr 

TTT 
phe 

GCA 
ala 

GAA 

glu 

CGG 
arg 



gly 

CCG 
pro 

CGA 
arc; 



TGA 
OPA 



GAT 
asp 



33/11 
AGC GTG GAC 
ser val asp 

93/31 
GTT CAA GCA 
val gin all 

153/51 
CAA GCC CCG 
gin a 1 :i p ro 

2 13/71 
CGG GTC CGC 
arq lev. arc; 

2 7 3/9. 
GAC CGG CAT 

3 3 3/1 ■ ; 



TGA 
OPA 

ACA 
thr 

CCG 
ala 



CGG 
arq 



AGT 
se : 



TCG 
ser 

CGA 
arg 



CGG 
arg 

CTA 
let: 



TAG 
AMB 

CAG 
gin 



CCG 
pro 

GAA 

gl u 



arg a ± a 



arg 

CAC 



qlu 

GGC 
g i y 

CGA 



GAG 
gl a 

GCG 
ala 

'^jG * 



arg 

CGG 
arq 



CCG 
pro 

GTG 
val 

CGT 
arg 

CAA 

(T 1 r, 
-J * " 

CAA 
q 1 n 



arq t:;r 



SEQ ID N ° 24 C 
FIGURE 24C 



WO 99/09186 



PCT/FR9801813 



93/185 



pro t h r 
61/21 
TCC AAT 
5 e r asn 
121/41 
CCj'j tcg 
arg se: 
16 1/61 
GT Z CTC 
va 1 vai 
2 4 1/31 
TCG GCT 
s^r ala 



361/12: 



; 2 : / 1 4 : 



TTT 
phe 

CGC 
a rg 

CCT 
■a la 

GAG 



lys £cr 

CCT TCC 
pro se: 



:tg 



CTC CAC 
leu his 

TGT CTG 



GCC 
aid 

CGG 
arg 

CCG 
pro 

CAG 
ql n 



^ro arq 



gin 



:;tc ctc 



A GGG 
o gly 

CCG 
pro 

AAA 

lys 

CC G 
se r 

GGC 
giy 

TTC 



leu 

TGC 
c:ys 

CGG 
a rg 



his 

AAT 
asn 

GGT 
gly 



giy giy 



ACC 
thr 

ATG 

met: 

GAA 
q l a 



31/11 

ACC TAA AA^ GAC TAG CGC CCA 
thr OCH lys A>!B arg oro 

91/31 

ATC TGC AAG ACC AGC GAC GGC 
ile cys lys thr scr aso gly 
151/51 

GAC CCT GCC GTA CCG TTG TTG 
asp pro aia va 1 u;o 1 leu 
2 11 '71 

AGC CAT TCC GAC ACT GGG ATC 



TGG 
t rp 

CCG 
pro 

CCA 
pro 



GCT 
al a 

TGG 
trp 

CTT 

leu 



TGA 
CPA 

TTG 
leu 

GAT 
asp 



J r. his se: a i 
a/91 



11 C AAA ACG 



TCC 



TTT 



:hr 



thr gly lie leu 1; 



gly giu qln 



3 3 1 / 1 1 1 
■TT GTG 



ACC AT 3 TAC 



j i T GAG GCC 
• r ^l el;: ala 



GAh 

^; i i; 



GAG 



1 'a 

i eu 



AAT' 

a s : \ 



a r 



SEQ ID M ° 27A 



FIGURE 



21 A 



WO 99/09186 



PCT/FR98/01813 



94/185 



3 3/11 

TAG CAG CAA GAG CCC AGG GCT TCA CAG GAC CTA AAA GGA GTA GGG CC^ ATG GG" TTG AT"" 
tyr gin gin glu pro arg ala ser gin asp leu lys aly val did pro g- leu i^e 

63/21 93/31 

CAA TTT TCC TTC CGC CCC GTG CAA TAC CAT CTG CAA GAC CAG CGA CGG CCC GTG GTT GCG 
gin phe ser pne arg pro val gin tyr his leu gin asp gin arg arg pro val va^ ala' 
123/41 153/51 

GTC GCG CAG CTT GCG GAA ACG GGG TAT GGA CCC TGC CGT ACC GTT GTT GCC A rm TGA ~ 
val ala gin leu ala glu thr gly tyr gly pro cys arg thr val val da Lhr OPA cvs 
193/61 213 H I 

C3T CGC TCT CCA CCC GTC GGG GGG CGA AAG CCA TTC CGA CAG 'TGG GAT CC^ CAA AA~ c^r 
arg arg ser pro pro val gly gly arg lys p:o phe a:g h:s trp asp pro gin asn va i 
243/81 273 -'91 

GGC TGA GTG TCT GCA GGG CTC CGG GGA GCA GCC GAT CAT CAC CAT GTA CGA ACT GAA ~AA 
gly OTA val ser ala jly leu arg glv ala ala aso ins his h's v^ 1 -, — fh- „i — - 
303/101 333/111 ~ ^ — 



GTC CCC CCC GCG CGA CTT CCA CAC ATT TGT TGT 



^GT TTC GGT TGA GG : CGA CGC GAG GCT 



va. pro pro ala arg leu pre asp lie cyr. cys qlv vh>i a.lv OPA glv a-- , - „ 



v> n a a . a a i a r> ■ 



4 2 3/141 



'g arg 



arq 



SEQ ID N° 27C 
FIGURE 27C 



SK^ m N' J 



\\ O 99/09186 



PCT7FR98 '01813 



95/185 



^KQLAArj^LVGACML.i\AGCrNVVDGTAVAADKSGrLHOD? I ^'^SALEG^LLOLSQINAALGAT S 
^FNAKAKWDWSKS^^^ 

G F P TAH DAE E F YS 5 S VQ S W 5 5 C 5 K R R FV E \T FT P GQ D D AA WT VA D VVN DN G M L S S 5 Q VQ EG G D G WTCO 
RALTARNNVTI DIVTCAYSQPDLVFTAIGIANQI AAKVAKQ ^^ooQVQE^DGrfTCQ 



SEQ ID N° 30 
FIGURE 30 



1/! 



31/;: 



ui. 



arg arq lie pro ala arg aLi a],! ir - a — 
61/21 



1/ 3 : 



thr p:a .s-r arg ala a:;; phe arq ',v 

121/41 



thr pre gly leu arc; qln pro iv^ r;o !e : >r ' 

181/61 ^ 7 , ;■ 

GTT CTG CCG CCT CGA 7C7 CAG CGC GGA CG'J CGT 

val leu pro pro arg s<»r ala arg a 1 v aiv i*-g 



a i j g - y c ya 2 PA t : 



thr pro thr ai: 



arg a^a gin a: 



sf.q :n 



figure .v, 



WO 99/09186 



PCT/FR98/01813 



GCG AAI ACC CGC GAG GGC AGC 
ala aan thr arg glu gly aer 

nl/21 

ACA TCC CAG CCG CGC ACG CTT 
thr ser gin pro arg thr leu 
121/41 

ACC AGG ATT GCG ACA ACC AAA 
thr arg lie ala thr thr ly3 
131/61 

TCT GCC GCC TCG ATC TCA GCG 
ser ala ala ser lie sor ala 



96/185 

31/} l 

GCG ACG CCG GCC CTG CCG 
ala thr ala ala leu pro 
91/31 

CCG GTA TGC GCC AGG ATA 
pro val cys qly arg lie 
151/51 

GCC CTC GCG CCT GGC TCG 
ala leu ala pro gly aer 

211/71 
CGG AGG GCG TCG AGA TC 
arg arg a! a .?er arg 



GCG CCG TGG CTG CTG AAC AAC 
ala pro trp leu leu asn asn 

AAC GAC CCC AAC AGC ACG AAC 
asn asp pro asn ser thr asn 

ATT TCG CGC GCA ACG CGG CGT 
lie scr arg ala thr arg arg 



SEQ ID N° 31C 



FIGURE 31C 



C?F ri'apr.>3 Cole et al . -Mature 1G 3 : 5 3 ^ b -i 4 ■ et conton.tr- ->gJ^\ 

1/1 Ti/i: 

taa arg acc cca an i eg.! • i 77a ttq c:;a d : — ^ 

^;^ hr thr pr ° thl ^ ^ ^ 5:y 1--; ^g n:o ly, pro 3C r a:, leu ala 

cga ttt cqc gcg caa eye ^ ctg cng f tcr c.ie 3,, c „ c „. c ., d ... 

•r^V" a ^ arg gly ,: leu pro pro arg ,, : !: ; ^ aC 3 ar ^ 

— l/'ii 151/51 

eee egg cgt cgt gtt cgt gge tea tea tct gca tee tee qyy ctt ggc cge get gac egg 

pro arg arg arg val arg gly 3P r 3 er ser ala ser ser giv 1,. -y arg ala L P a % 

cag eee gae „ ... ear • ear; : ; ,z gge gey : : egg c:, e:e age : ,- ;; tg eg- 

g in pro asp pro arg r., 3 a, a gin ala a=p gly dij pro , r , 1,, pro c : ly ,; v va 1 ar, 

5 ~? ? f C C;:::: g?t " ' ' : - ' ^ :: r.r- : ,;;,t gtg :;t 7 cqc 

— < l! * ^' ^ ^ ,, ; ,i v .,7 ,1, Vdl ; tl ? ^ 

^ ~ 1 - : " ::v. T": c--: 7:7 ;i . : : : : 

.irg arg ph.c gly .-i:-; - - ■ ' -■«•-■■■ - 

^:c;i 

go a ::-g :m- j.r.; :: j .; „ : 

.71^ v:,: his -In a 1 .1 p: ^ .. , . . ... 

^21/141 ■ 

" - • - ^ ■ • :* G : :.: : ; 
1 all r r ; ■ . ■ - 



1 ; 1 

0 7 V 

:'^7' t i: ; '.' ; 1 \'. 1 
i . 1: 7 : • • ; • :■ 



■5 1 ' 1 ' 



WO 99/09186 



PCT/FR9H/01813 



97/185 



1/1 

aga ctg gtg tac acg 
arg leu val tyr thr 
61/21 

eta gtg aag gtc att 
leu val lys val ile 
121/41 

ttc gtc ggt ttc gcg 
phe val gly phc ala 
181/61 

ccg ttg egg gac tac 
pro le-.; arg asp tyr 

2 '1 1 / 0 1 

ggg ccg acc gcg ctg 
gly pro thr ala leu 

3 n i / in i 

tac ggg eg- .it- aaa 
tyr gly arg : > lys 



gag acc aag ctg aac 
glu thr lys leu asn 

cag aaa ctg teg ggc 
gin lys leu ser gly 

egg rft.cj gtc gag gec 
arg rr.et val glu ala 

gaa ctg ggc acg gtg 
glu leu gly thr val 

aac tat g-g eg- get. 
asn tyr val arg ala 

cgc cag cag ttg ttt 
are aln r t ) : . leu phe 



31/11 

teg gca ttc tec ttc 
ser ala phe ser phe 
91/31 

ttg age: ate aac egg 
leu ser ile dsn arg 
151/51 

etc ggc ggc gtc gag 
leu gly gly V al glu 
211/71 

etg gag cic gec gga 
leu glu his ala gly 
271/^i 

eg. t '_.ig g7c acc ace 




ggc ggg cct aag tgt 
gly gly pro lys cys 

ttc ate gcg att gac 
phe ile ala lie asp 

gta tgc age acc ace 
val cys ser thr thr 

cgc cag gtc att gac 
arg gin val lie asp 

gag age aat: ggc gac 
g 1 u ser as n g ; y asp 

egt Leg arg arc 



SEQ ID N° 32A 
FIGURE 32A 



W O 99/09186 



PCT/FR98/0I8I3 



98/185 



l/l 

act ggt gta cac 
thr gly val his 
61/21 

agt gaa ggt cat 
ser glu gly his 
121/41 

cgt egg ttt cgc 
arg arg phe arg 
181/61 

gtc gcg gga eta 
val ala gly leu 
241/81 

gec gac cgc get. 
ala asp arc; ala 
301/101 

egg gcg cat caa 
dry ala his gin 



gga gac caa get 
gly asp gin ala 

tea gaa act gtc 
ser glu thr val 

gcg gat ggt cga 
ala asp gly arg 

cga act ggg cac 
arg thr gly his 

yaa eta tgt gcg 
glu leu cy3 ala 

acg cca qea gtt 
t.hr pro ala va 1 



31/11 
gaa etc ggc att 
glu leu gly lie 

91/31 
ggg ctt gag cat 
gly leu glu his 

151/51 
ggc cct egg egg 
gly pro arg arg 

211/71 
qgt get gga gca 
gly ala gly ala 

271/91 
cgc teg cca ggt 
arg ser pro gly 
331/111 
gtt ttt gtc gtc 
"f»l phe val val 



etc ctt egg egg 
leu leu arg arg 

caa ccg gtt cat 
gin pro val hi3 

cgt cga ggt atg 
arg arg gly met 

cgc egg acg cca 
arg arg thr pro 

cac cac cga gag 
hi 5 his arg glu 

get get gcg ttc 
a^a ala ala phe 



gec taa gtg tct 
ala OCH val ser 

cgc gat tga ctt 
arg asp OPA leu 

cag cac cac ccc 
gin his his pro 

ggt cat tga egg 
gly his OPA arg 

caa tgg cga eta 
gin trp arg leu 

qat gat r 
asp asp 



SEQ ID N° 32C 



FIGURE 32C 



sequence Rv0322c predrte par Cole et al. (Nature 393:537-544) et contenant seq 32A 



eq 

^ 31/11 

atg agt gac ggc gag age gec gcg ccg tgg gca egg etc tec gag tea gca ttc ccc gat 

e pro asr 



Met 3 er anp gly glu 5 er ala a, a pio tip ala arrj leu ser glu ser ala pr 



61/21 91/31 

gqt gtt qac caa tgg at, , „■ ,ta ccg ccc gec *r, tgg gtg g=a get cag ggt ccg egg 

l\\; 4 T asp ar5 trp Uc thr " 3 "p -i a".. al„ g: „ J y pr ^ £ 

qac acc caq a at crtc eqc r-'*" ~- i - c."'" r — 

J - ^ — gtg gc-: gar etg ate gee 



a:>p thr gli; ,i— val gly cy<; 1)-- ,ili thr gly ala v.il :> 



1 S 1 / 6 1 

""" v' 1 " etc acg ca.: - : : 



i 1 ■? ' 



icp j.eu Lie aia 

211/7 ; 



arg x e u g l y p r o a 1 a u he r r o a s 1 c i 
24 1/81 

cca tec gqc cqc qgc ccq aaq r;tc 

: a :>*' r I v -i r q cl'.- r> : a Ivi *.* i 1 



^ v-il ala pro q.a ~ ~ 



' l t c q 



2 / 1 / 9 1 

Q<3 a qa q : 
"1 "■>]- .1 1 . i i . ■ 

3 J 1 / 1 1 1 



a 5 . i 



c ; c c i 



q jl u 



WO 99/09186 



PCT/FR98/01813 



99/185 



661/2 21 

cag cat ggc gac gag 
gin his gly asp glu 
721/241 

aat arc ggc gcc ggc 
asn ile gly ala gly 
781/261 

gtc aac att ccg gcc 
val asn ile pro ala 
841/281 

ate act cca ate caa 
lie thr pro lie gin 
901/301 

gac gag aag acg gga 
a3p glu lys thr gly 
961/321 

gca ttc tec ttc ggc 
ala phe ser phe gly 
iUJi/341 

age ate aac egg ttc 
ser ile asn arg phe 
1051/361 

ggc ggc gtc gag gta 
gly gly val ylu val 
1141/331 

gag ca: gcc gga cgc 
glu his ala gly arg 
1201/401 

cag gtc ace acc gag 
gin val thr thr glu 
1261/421 

teg tcj ctg ctg cgt 
a er ser leu leu arg 
1321/441 

aac gtr gtc aac atg 
asn val val asn met 
1331/461 

gtc gai etc ggt cga 
val glu leu gly ar g 
14 4 1/461 

ccg a~; ggt due 
pro thr gly ile thr 
1501/531 



aac ttc ttg etc gtc 
asn phe leu leu val 

gac gcc gag gac gcc 
asp ala glu asp aid 

age cgc gag egg gtc 
ser arg glu arg val 

tgc gag gcg tgg aac 
cys glu ala trp asn 

acg atg ggt ccc aga 
thr met gly pro arg 

ggg cct aag tgt eta 

ql y pro 1 y f? cyr, Iru 

ate gcg att qae trc 
ile ala ile asp phe 

tg r: age acc acc ccg 
ry s ser thr thr cro 

cag gtc att gar ggg 
gin val ile asp gly 

age aat ggc gac tac 
ser asn gly asp tyr 

teg atg ate teg acq 
ser met ile sc: thr 

ttc ate ggt a a c a g c 
phe ile gly asn ser 

teg ttg cag cat atg 

gac cag a a ; g - i - 
asp gin a r> n g 1 y a li : : 



691/231 

ggt atg gac tct cgt 
gly net a3D 3er arg 
751/251 

ggc qgc gca cgt teg 
gly gly ala arg ser 
811/271 

gtc gcg gtg teg ttc 
val ala val ser phe 
871/291 

ccc gag acc ggt aag 
pro glu thr gly 1 vs 
931/311 

ctg gtg tac acg gag 
leu val tyr thr glu 
991/331 

gtg aag gtc att cag 
Veil iys va; lie gin 
10 5 1 ' 35 1 

gtc g t ttc erg egg 
val ily al i arg 

1 1 1 1 ' i ; : 

ttg egg i \~ t a ". gaa 
leu arg asp tyr glu 
1171/391 

ccg arc g;g gtg aag 
pro thr <.ild I-;; d:gg 
1231/411 

ggg cgc atj aaa eg;; 
gly arc ^le iys arg 
1291/421 

g;ic : • ttg t t . : 
asp th: leg rh»« : ig: 
13S!,'4 : 1 

tyr "al •. 



gcg 



1531 , 5 : 



gcc ggg gcg aac gcc 
ala gly ala asn ala 

gac acc gtc atg ctg 
a3p thr val met leu 

ccc cgc gac ctg gcg 
pro arg asp leu ala 

tac gga ccc ate tac 
tyr gly pro ile tyr 

acc aag ctg aac teg 
thr Iys leu asn ser 

add ctg ten g-g ttg 
iys leu ser gly leu 

atg gtc gag gcc etc 
met val glu ala leu 

ctg ggc acg gtg erg 
leu gly thr val leu 

tat gtg cgc get cgc 
tyr val arg ala arg 

cag cag ttg ttt ttg 
gin gin leu phe leu 

etc age a g g etc aac 
1 *"a ser arg leu as n 

aag acg aaa gac ctg 
1 y 3 t h r 1 y a di p 1 e u 



WO 99/09186 



PC.T/FR98/018I3 



100/185 



1921/6-31 

etc age gcg gtg cgc 
phe ser ala val arg 
1931/661 

aac tec tec age cca 
asn ser ser ser pro 
2041/6B1 

acc acc tgc gag tag 
thr thr cys glu AM3 



get cce ctg ccg agt 
ala pro leu pro aer 

ccg acc aag ctg ccc 
pro thr lys leu pro 



1951/65! 

ggc tec acc gtc age 
gly ser thr val ser 
2011/671 

gag gac ctg acg gtc 
glu aap leu thr val 



gtg cag ata age cgc 
val gin lie ser arg 

acc aac gec gec gac 
thr asn ala ala asp 



SEQ ID W° 32D (suite 2) 
FIGURE 32D (suite 2) 



OR: d'aprtis Cule e t al. (Nature 3 93, : 5.1 7- 54 4 ) e* 



cent on ant P,v: 



/ i 



j i / 1 : 



tag gac atg agt gac gqc gag age gee gcg ccg Lgg gca rgg etc tec qa q tea gca ttc 

AX3 aap ~et ser a.sp gly glu ser ala ala pro trp ala arc leu s-r gl- 3e - a' a 
61/21 91/31 

eee gat get gtt gac cga tgg ate acg qta cca cee gec aca tgq q-q q--a g — c r* a-' 

pro a 3 p gly val asp arg trp He thr val pro pre ala Lr .r - P val ala ala gin gly 



121/41 



IS 1/51 



ccg egg gac ace cag aat gtc ggc tgt cat gec acc ggc qec gf ar g-q g-c ga- — ~ 

pre arg asp thr gin a 3 n val gly cys hi 3 ala thr gly ala val 3 e: val ala aLp 'e^i 
1 9 L / 6 1 211/71 

at: gec agg etc ggc cee get ttt cct gac etc :c a.:,; a - cc; eat gt. g-- err 

lie ala arg leu gly pro ala phe pro asp lea rr- thr his are - 5 val ,va c-o civ 
2 41/31 j , , : ' * ^ ' 

cc: gd? cca — - yy- * <^ : ; "~ -at- g ti - g i: ; a . v: ca , ;: ca ac ,„ 

prD glu pro set gly org gly pre lya val h:a a-.p 



301/101 : - 

qa.7 get ate qec ate eeg gee enc tea ct e oa ; 

elu ala lie ala 1 1 e pre a* a re: c s-r l^u elu 

all ala acai tyr pro arg ala a 3:- his ala are 
■12 1/14 1 .-e ■ 



a..i a:ae aap one gin as: 



eee a 1 ;j 



WO 99/09186 



PCT/FR98 01813 



101/1B5 

3-1 1/281 37 1/29: 

erg gcg ate act: cca ate caa tgc gag gcg tgg aac ccc gag acc ggt dag Lac gga rcc 
leu ala lie thr pro lie gin cys glu did trp asn pro glu thr gly ly 3 tvr c^v 

901/301 931/3 i: g v ^ jr g ^ y 

ate tac gac gag aag acg gga acg atg ggt ccc aga ctg gtg tac acg gag acc aag ctg 
lie tyr asp glu lys thr gly thr met gly pro arg leu val tyr thr glu thr lys leu 
961/321 991/331 

aac teg gca ttc tec ttc ggc ggg cct aag tgt eta gtg aag gtc att cag aaa ctg teg 
aan ser ala phe ser phe gly gly pro lys cys leu val lys val He- gin ly 3 leu ser 
1021/341 1051/351 

ggc ttg age ate aac egg ttc ate gcg att gac ttc gtc ggt ttc gcg egg atg gtc gag 
gly leu ser He asn arg phe He ala lie asp phe val gly p h- ala arq -At val clu 
1001/361 1111/371 J 5 

gec etc gqc age gtc gag gta tgc age acc acz zzg ttg egg gac tac gaa ctg ggc arg 
ala leu gly gly val glu val cys sor thr thr pro leu arg asp tyr glu leu gly thr 
1141/331 1171/391 

gtg ctg gag cac gec gga cgc rag gtc att gac ggg ccq acc acg ctg aac ta- grg C g~ 
val leu glu his ala gly arg qir. val He asp ;ly pro thr ala leu asn tvr val a- 
1201/401 1231/411 

get cgc cag gtc acc acc gag age aat ggc ga : tac gqq cgc a— aaa eg- cag cag t — 
ala d rg gin val thr thr glu ser asn gly asp tyr qlv arg He l V3 arg qH C 
1261/421 1291/431 

ttt ttg teg teg ctg ctg cgt teg atg ate tjg acg gac acc ttc ttc aac etc age a—; 
phe leu sor scr leu leu arg ser rr.e t lie ^r th; asp thr leu nne a. -in leu 3 or a- 
1321/441 1351/451 * ' 

etc aac aac gtc gtc aac atq ttc ate ggt aac age tac gr g qa .~ aac qtc aag ac „ aaa 
leu 33n asn val val asn met phe He gly asn ser tyr val asp asn val lys t>- lys 
1331/4 61 v, :i, 47] * 

gac ctg gtc gaa etc ggt cga teg ttg cag cat atg gcg qcc qgg CJ e gtc d jg f c gr~ 
asp leu va. glu leu gly arg ser leu gin hi 'i r.er ala ala glv his val th- D -e -a' 
14 4 1 /48 1 1 4 ' 7 1 / 4 H ' * * 

ace gtt ccq acc ggt ata acc gac cag aac ggc cat gag ccc ccg cgt acc tec gac atg 
thr val pre thr gly lie thr asp gin ,i 3 n qly asp ql 
15(31/501 IS J 1/ HI 

aag gcg ctt ttc ace gee ate ate gac gac gat cca c: 



: : j p r arg t h r s <■» r asp r?,e: 



lv3 ala lee rhe thr al: 
1561/52 1 

gec ea g c g t c L g gg c a a 

Hi gin are leu ql y as 
1621/541 

acq get etc arc a ic g i 

aid gly ieu thr" asn gl 
HH/5H 

aca gtg csc q- c — a > 



-c ctg gaa air q a »- cac 
asp asp asp pro 1 e u no l» u gH asn a:ip his 



acq erq ca , 



WO 99/09186 



PO7FR98/018I3 



102/185 



1/1 


















3 1 / 1 1 




CGT CAC 


CTC 


TGC 


CAT 


GGT 


CCA 


TCT 


ACG 


GTA 


1 CT bCG 


ACA 


a r g h i s 


leu 


cys 


his 


gly 


pro 


ser 


thr 


val 


ser ala 


thr 


61/21 


















91/31 


CAT GCA 


GAG 


TCG 


GTG 


TTC 


GCT 


TCA 


CGC 


GAA 


CTA GGC 


GCG 


his ala 


glu 


ser 


val 


phe 


ala 


ser 


arg 


glu 


leu gly 


ala 


121/41 














151/51 




GGC CGA 


CAT 


TCG 


CCC 


GAG 


GCC 


TTG 


GCC 


TCC 


ATC ACC 


TAA 


gly arg 


his 


ser 


pru 


glu 


a 1 a 


leu 


ai a 


ser 


ile thr 


OCK 


181/61 


















211/71 




ATT GAT 


ACG 


ATT 


GCG 


CAC 


AT G 


GCT 


ATC 


TGG 


GAT C 




lie asp 


thr 


i 1 e 


ala 


his 


me t 


ala 


lie 


trp 


asp 





FIGURE 33A 



1/1 31/U 

GTC ACC TCT GCC ATG GTC CAT CTA CGG TAT CTC CCA CAA GCG CAG CG~ CG^ 1 r~ 

val thr ser ala ::;e t v.-i 1 his lev t-- 1 r ., ^ ^ _i . , *" ^ ' 

^ ar ^j C^- g-v arg arg se: I*.-: -ss^ 

ol/21 9V31 

ATG CAG AGT CGG TGT TCG CTT CAC GCG AAC TAG GCG CGC CTA GCC TGG ACG ACT CCC CGG 



i e u a -a r:p thr 



1 S 1 / 5 

A.TT CGC CCG AGC CCT TGG CCT CCA 
ala asp :io arg pre arg pro trp pro p:o : , r) a ; » - 

13 1/61 ? - w', - 



a r 



rr.et g^n ser arg cys ser leu his ala asn AM 3 ala a" 
121/41 

GCC GAC ATT CGC CCG AG C CCT TGG CCT CCA TCA CCT AAT TGT GTG CAA AAC CGT A"*" 



SEQ ID N ' 33B 
FIGURE 3 3R 



WOW/091K6 PTT/FR98/01813 



103/185 



sequer.ee RvlO-M prcdite par Cole et ai . (Nature 393:5.17-54 4) et cor.te.na.it seq33 



^ 31/11 



ttg tgt gca aaa ccg UL eta att gat acg ate gcg cac atg get ate tgg gat cge etc 

leu cys ala lys pro tyr leu lie asp Lhr He ala his met ala He trp asp arq leu 
ol/21 91/31 

gtc gag get gee gee gag caa eat ggc tac gte acg act cgc gar. gcg cga gae ate gqc 

ya glu val ,1a ala glu gin his gly tyr val thr chr arg asp ala arc, asp He gly 
121/41 151/51 Y 

gtc gae ecc gtg cag etc cgc etc eta gcg gg ; ; ccc gqa c:;: ctt gag cgt gte ggc cga 

ya. asp pro val gin leu arg leu leu ala gly arg gly arg leu glu arg val glv arg 



211/?: 



ggt gtg tac egg gtg ccc gtg ctg ccg cgt ggt gag gac gat etc c/m , r , 

q l Y :Z^ ^ " 9 Vdl p: ° V=! ' leu ?rC ^ ^ asp asp ieu ala ala ala va i 

' "'»" " :: ; - ' =3t gg= gtt ate teg cat •: , • •, ,. = a .. . CJC ._.„ 

thr leu :jlv a " C)] V val lie set hs, cLa ,-: : ,c all l-c his ala 1<>u 

yet gac gtg aac ccg teg cgc ate cat etc ac:- eta c. c c:: aac aa: cat ccg cgt ccg 

a : a asp va. as, pro ser arg ale his leu thr val pre arc asn asn hrr, ore arc ala 

gee ggc ggc gag ctg tac cqa att cac cgc ecc - ; c •. . ca.j »::., gec cac gtc act tc~ 

gly ^ ^ • V* "3 val his arc arg a : leu glr. ala ala va ■ thr .>•• 

i Z 1 / 1 4 i £ ) 1 / 1 - ; ' 

gtc gac gga ata ccc gtc acg ac; gtr. g-g car a 7: v.: aaa gac tgc gtg aag acg gec 

val asp gly pro val thr thr val ala . ; .. ; ,, , ; :ys lys ,, r 'I,., 

acg eat ctt tat cag ctt cgc gec ccc ate c.Vr^ , , caa cac, cgc acg c- • c ~ 

sSi/iai !>r ° 71:1 L '^' ; irg 3l ' 1 ;: " r--: r : 1 ' : ' " il ::1 ' J ^ J - 

= ~ r f J r-y- gag = ta c,: c. • e ; !- ccc c ?! tea cat: 

I//! : ' iv .t-.i l-.-u arc al a ! , ; : :' • : . : -.cr , ; .. ; . . »,,.. ; . .. ;. , 

'.j ^ ^ / Z j i ' 

" ' : " ' : 1 : ' "-' : ' • * : ' : t g i 



WO 99/09186 



PCT/FR98/01813 



104/185 



OR.- d'apres Cole et. a;. (Nature 393 : 5 3 7-5-14 ) et contenar.c RvlOAi 
1/1 31/11 

taa teg tgt gca aaa ccg tat eta att gat acg att gcg cac aty get ate tgg gat cgc 
OCH leu cys ala lys pro tyr leu ile asp thr He ala his met ala He trp asp arg 
61/H 91/31 * 

etc gtc gag gtt gec gec gag caa cat ggc tac gtc acg act cgc gat gcg cga gac ate 

leu yal glu val ala ala glu glr, his gly tyr val thr thr arg asp ala arg asp He 
121/41 151/51 

ggc gtc gac cct gtg cag etc cgc etc eta gey ggg cgc gqa cgt ctt gag egt gtc gqr 

gly val asp pro val g iM leu arg leu lou ala gly arg gly arg leu glu arg vai gl y 
ldl/ol .Ml/71 y y 

cga ggt gtg tac egg gtg ccc gtg ctg ccg c:jt ggt g,g c;,c gac gat etc gea gee gea 

arg gly val tyr arg val pro val leu pro arg gly glu his asp asp leu ala ala ala 
-141/91 2 '1/91 

d :'- " C;J ^ C ^ ™ c 9 ct atc ^9 cat gag teg gec ttg gcg ctt cat gec 
thr leu 3 _y arg gly val lie ,.. r hi, glu ser ala leu ala leu his ala 



c ^^j ugg d 
val ser trp 

3 01/101 



331/11 L 



etc get gac gtg aac teg cqc ate cat etc ace gtc ccg jgu a 



, , , - .^c aac cat cc:; cqt 

leu ala asp va. asp. tjtd ser arg :le his r , _ _ t . 3 ^ 

361/121 ' 3^;^ ^ ^° a ^ aSn aSn hi > ^ a ^ 

gcg gec ggg ggc gag ctg tac cga gtt cac cgc cgc gac etc cag gca gee cac cte act 

ala a a giy gly q - u leu tyr arg val his arg arg a,p leu gin ala ala his val th- 

" Cg JaC a ? a CCC ac ^ "3 ^ 3^9 cqc ace atc aaa gac tgc gtg aau acg 

ser vai asp gly lie pro val thr thr val ala arg thr He lys as, cys val lys ^ 

ggc acg gat cct tat cag ctt egg gec gcg atc gag eg, gec gau gec gag ggc acg ctt 

gly^tnr asp pro tyr gin leu arg ala ala :le 5 lu ar, ul. g i, ala glu gly thr leu 



1/191 

' ^ 33^ -ta cgc 



Tgt. cat ggg t.r^ gea grt gag eta ege get ge-j etc cat gag aee act c;c 

arg arg gly ser ala ala glu leu arg ala all l->u -is-. - ^ -i • 

601/20 1 : ^'^ k *" a c, ~' 

ala a r j pre 1 \v, are ala r,e: aia C, PA 



SEQ ID M° 33F 



WO 99/09186 



105/185 



PCT/FR98/01813 



1/1 31/11 

TCC AAC CTG CTG GGC CTG CGC CTT CGA ATC GAC GGC CAG GCC ACC GCT CGC TGC CGG CAA 
ser a 5 n leu leu gly leu arg leu arg He asp gly gin a la thr ala arg cys arg gin 
61/21 91 / 31 

CAA CAC CTG GAA TGG GGA CCT TTT CGG TGT TGC TGG TAA CCG GGA CAA CCG GCA CCA CGC 
gin his leu glu trp gly pro phe arg cys cys trp OCH pro gly gin pro ala pro arg 
121/41 151/51 

CTC GGT CGA GAC GTA TCG CGG CAG CGT TGG CCC TGT CGT TGC TGA CAA TTA CCG CTG GCC 
ieu gly ar 5 as P vai set arg gin arg trp pro cys arg cys O PA gin leu pro leu ala 
181/61 211/71 
GCC GCA TAT TTG CCG CGC TGC CGC GGG CCG GAT C 
ala ala tyr leu pro arg cys arg gly pro asp 



SEQ ID N° 34B 
FIGURE 34B 



1/1 31/11 

GAT CCA ACC TGC TGG GCC TGC GCC TTC GAA TCG ACG GCC AGG GCA CCG C~C r.~™ 3CC GG' 

asp pro thr cy, trp ala cys a 1 a phe glu ser the ala arg oro 1 - ; a 1 a al ^ -I' 

61/21 91 /3: ' " ' 

AAC AA: ACC TGC AAT GGC GAC CT" 1 "" : ~ r,-;- ~~ T r — — — ■ - - ^ 

. 0ii o^i , T u.'V- /u\C CoG CA i 'V 

asn asn thr trp a sr. gly asp Leu pre rf.y val ala v a,;: ,: : a^n as- a- - - ^ 

] 71/4 1 1 /r. ! ^ ' ' " 4 



a. a ser va . g;u 
13 1/61 



g ^ y p :. o v j 
ni/7: 



WO 99/09186 



PCT/FR98/01813 



106/185 

ORF d'apres Cole et al. (Nature 393:b37-544) contennant seq34A 
1/1 31/11 



tag ccg caq ggc cct gcg get agg cgc ggc egg tgc cgt tyg ccg egg egg caa teg atg 
AMB pro gin gly pro ala ala arg arg gly arg cys arg trp pro arg arg gin ser met 
61/21 91/31 

ttg cag cag tta caa cgc caa atg gag tct gag cgc ate gtc gag ttc gat cag etc ggc 
leu gin gin leu gin arg gin met glu ser glu arg ile val glu phe asp gin leu gly 
121/41 151/51 

agg gga gac gtt gcg cag cga egg ate caa cct get ggg cct gcg cct teg aat cga egg 
arg gly asp val ala gin arg arg He glu pro ala gly pro ala pro ser asn arg ara 
131/61 211/71 y g 

cca ggc cac cgc teg ctg ccg gca aca *ca ccc gga atg ggg acc ttt Leg gtg ttg ctg 
pro gly his arg ser leu pro ala thr thr pro gly met gly thr phe ser val leu leu 
241/81 271/91 

gta acc ggg aca acc ggc acc acg cct egg teg aga cgt ate gcg qca gen g gzc cLc; 
val / hr 1 } y thr thr r J ] y Lhi P rQ arg ser arg arg lie ala ala ala leu ala leu 

301/101 331/111 

teg ttg etg aca att acc get ggc cgc cgc ata ttt gec gcg ctg ccg egg gec gga tec 
ser leu leu thr ile thr ala gly arg arg ile D he ala ala leu p-c a— a^a -1- spt 
361/121 391/131 ^ ~ ^ ' 

agg teg acc tgc cag ate tea ccg cgc age ate tac gec gtt cgc tqc aaa cca e-g a-t 
arg ser thr cys glr: ile ser pro arg ser He tvr ala val arg cys lys D ro pro thr 
421/141 431/151 

gcg acg gca ggc cca etc tct tgg cat gcg tec aat get gcg acg tec teg gta qac aag 
ala thr ala gly pro leu ser trp his ala ser asn ala ala thr ser ser val aso lvs 
481/161 511/171 P y 

etc acg ctt ggc ttc atg ccg cag tec tac cca tgt agt aac aga tag 
leu thr leu gly phe net pro gin ser tyr pro cys ser asn arg AMB 



SEQ ID N° 34F 



FIGURE 34 F 



WO 99/09186 



rCT/FR98/018I3 



107/185 



1 / 1 


















31/11 






gac ac;^ 


CTG 


TCG 








GAC 


GCA 


TGC 


CAC TCT 


CCG 


ATC 




leu 


ser 


<X X a 


a r g 


arg 


asp 


ala 


cys 


his ser 


pro 


lie 


O 1 / £ I 


















91/31 










GC<j 


CTC 


TCT 


ACG 


CCG 


AAG 


ATC CCA 


AGT 


TCG 


t hi IT 3L JT g 




arg 




leu 


ser 


fc. U v 

tar 


p ro 


lys 


i 1 e pro 


ser 


ser 


121/41 


















151/51 






GGG GCT 


TCC 


GCG 


CAC 


CGA 


CCG 


CGC 


GGC 


GGC 


GCC TG Z 


AGG 


GCG 


gly ala 


ser 


ala 


his 


a r g 


pro 


arg 


gly 


gly 


ala cys 


arg 


ala 


181/61 


















211/-1 




GTC TGG 


GGA 


TGT 


TGG 


TTT 


CCG 


vjCG 


TGG 


CGT 


TCA AAG 


AG A 


CCA 


val trp 


gly 


cys 


trp 


phe r 


pro 


ala 


trp 


ar-j 


ser lys 


aig 


p r :> 


241/81 
















271/91 






TAG TCA 






TCC 


."TT 






T GA 


1 b ; 


TCG GTG 


GTG 






a 1 a 


phe 


ser 


val 


leu 


ser 


CPA 




ser v a ^ 


va 1 




301/101 


















3 31/111 






C JC GGT 


i bT 


CCG 


GCA 


GGA 


i G G 




GTG 


GCG 


GAT CGG 


CTG 




:e: S gly 




p r o 


ala 










a 1 a 


asp j:.; 






301/121 


















3 91/131 






GTA CCA 


AGG 




CCG 


GGG 


GCT 


CAT 


T C A 


CCA 


GCC GTA 


T G G 


/\AG 


val pre 


arg 


r 1 - y 


pro 


cly 


ala 






pro 


a 1 a v a 1 







met ser ser gly cys leu 



TGA TCG GAA GTT TCC CGA 

CPA ser glu val ser arg 

TGT ATG CCA TCA CCG GTC 

cys met pro ser pro val 

GGG CTT CGC GCC AGC GTC 

g 1 y leu arg a 1 a s e r vaL 

ATC 

l le 



SEQ ID N° 35B 
FIGURE 35B 



WO 99/09186 



PCT/FR98/01813 



108/185 



sequence Rv2169e predUe par Cole et al. (Nature 393:537-54 4} et rontena. 
partiellement seq35A 

1/1 31/11 

atg cca etc tec gat cat gag cag egg atg ctt gac cag ate gag age get etc tac gee 
Met pro leu ser asp his glu gin arg met leu asp gin ile glu ser ala leu tyr ala 
61/21 91/31 

qaa gat ccc aag ttc gca teg agt gtc cgt gge ggg ggc ttc cgc gca ccg ace gcg egg 
glu asp pro lys phe ala ser ser val arg gly gly g!y phe arg ala pro thr ala arg 
121/41 151/51 

egg cgc ctg cag ggc gcg gcg ttg ttc ate ate ggt ctg ggq atg ttg gtt tec ggc q~r 
arg aig .en gin gly ala ala leu phe He ile gly i eu gly met lou Vdl ser L yal J 

191/d1 211/71 

gcg ttc aaa gag ace atg ate qqa agt ttc eeg ata :t, agn gtt etc ggt ttt gtc gtg 

ala phe lys glu thr net lie gly ser phe pro He ieu ser val phe a i-. nh, v.. : IJ 

241/81 2 7 1/yl - " ■ 

ate ttc ggt ggt gtg gtg tat gec ate acc ggt cct cgc, ttg tec ggc agg atg gat cgt 

:-.et phe qly gly val val tyr ala ile thr yiy pro arg leu ser aiv arg m»t as-a a'- 

331/101 331/111 ' ' 

ggc gga teg get get ggg get teg cgc cag cgt cgt acc aa, ggg gec ggg gg c tea ttc 

g.y g y ser ala ala gly ala ser arg gin arg arg thr lys gly ala gly ylv ser F h» 

3ul/i21 391/131 

acc age cgt atg gaa gat egg ttc egg cgc cgc ttc gac gag ta;i 

thr ser arg rr.et glu asp arg phe arg arg arg pht- asp glu OCV. 



SEQ ID N° 3SD 



FIGURE 35D 



WO 99/09186 



PCT/FR98/018I3 



109/185 



1/1 


















31/11 


















GAC CTG 


GGA 


CGA 


AGA 


CGA 




par 


par 


CCG 


CAA TCA 


GAT 


CTA 


CCC 


GGT 


CCT 


GGT 


CAA 


CGT 


asp leu 
61/21 


gly 


arg 


a rq 


ara 


arg 


gin 


gin 




n 1 n <; 0 *• 

y x j 1 ser 
91/31 


asp 


leu 


p ro 


gly 


p ro 


gly 


gl n 


a rg 


CAA TGG 


ACA 


CCC 




TAP 


<3\J I 




CCT 


GCG 


CGG CTC 


GAC 


AAT 


GCG 


CGG 


TTC 


CTG 


TTG 


CCC 


gin trp 


thr 


d r o 


a s d 


t vr* 
j 


91 y 


ala 


pro 


ala 


arg leu 


asp 


asn 


ala 


arg 


phe 


leu 


leu 


pro 


121/41 


















151/51 












GTG GTC 


GGA 


GTG 


CCA 


CCC 


GAC 


CAG 


GCC 


ACC 


GAC TTC 


GGC 


tc: 


GCT 


GTT 


GCA 


CCA 


GAA 


ACG 


val val 


gly 


Vdl 


pro 


pro 


asp 


gin 


ala 


thr 


asp phe 


gly 


ser 


ala 


val 


ala 


pro 


glu 


thr 


161/61 


















211/71 












ACG GCG 


CCG 


GTC 


TGG 


ATC 


ACC 


ATG 


CTG 


TGG 


CCG CTG 


GCC 


ga: 


CGG 


CCC 


CGG 


TTG 


GCC 


CCC 


thr ala 
241/81 


pro 


val 


trp 


lie 


thr 


met 


leu 


trp 


pro leu 
271/91 


ala 


a sp 


arg 


pro 


arg 


leu 


ala 


pro 








GGC 


ACC 


b'i'T 


CCC 


GTC 


CG j 


CTG GTC 


GAC 


GAC 


GAC 


CTC 


GCA 


AAC 


TCG 


CTG 


g 1 y ala 


pro 


gly 


gly 


thr 


Vd 1 


pro 


val 


ar j 


leu val 


asp 


asp 


asp 


leu 


ala 


a sr. 


ser 


leu 


301/1C1 


















331/11 1 












GCC AAC 


GGC 


GCC 


CGG 


CTG 


GAC 


ATC 


CTC 


CTG 


TCG GCG 




GAG 


TTC 




ACC 


AAC 




GAA 


ala a s n 
361/121 


gly 


r> x 1 


arg 


leu 


asp 


lie 


leu 


leu 


ser ala 
391/131 


ala 


glu 


phe 


ala 


Lhi 


a s n 


arg 


glu 


GTC GAC 


CCC 


GAC 


GGC 


GCC 


GTC 


GGC 


CGA 


GCG 


CTG TGC 


CTG 


GCC 


ATC 


GAC 


CCA 


GAT 


C 




val asp 


p ro 


asp 


gly 


aid 


va 1 


gly 


arg 


ala 


leu cys 




a ] ;\ 


ile 


asp 


pro 


as d 







SEQ ID N° 36A 
FIGURE 36A 



31,'" 1 




WO 99/09186 



PCT/FR98/01813 



110/185 



l/i 

CCT GGG ACG AAG ACG ACG 
pro gly thr lys thr thr 
61/21 

ATG GAC ACC CGA CTA CGG 
ir.et asp thr arg leu arg 
121/41 

GGT CGG AGT GCC ACC CGA 
gly arg ser ala thr arg 
1 81/61 

GGC GCC GGT CTG GAT CAC 
gly ala gly leu asp his 

2 U / 8 1 

* w~ j T'j j CAC CGT 
gly thr arg trp his arq 

3 01/1 31 

CAA CGG CGG CCG GCT GCA 
glr. arg a : g p:,; a ! a g; y 
361/121 

CGA CCC CGA CGG CGC CGT 
arg pro arg arq a g arg 



31/11 

GCA GCA GCC CCA AT C AG A TCT 
ala ala ala ala 1I-2 arg ser 
91/31 

TGC GCC TGC GCG GCT CGA CAA 
cys ala cys ala ala arg gin 
151/51 

CCA GGC CAC CGA CTT CGG CTC 
pro gly his arg leu a eg leu 

2 12/7: 

CAT GCT GTG GCC GCT GGC CGA 
his ala va 1 ala ala g 1 v a r g 

2 / 1 / 9 f 

I^c CGT CCG GCT GGT CGA CGA 

3 3 1/111 

CAT CCT CCT GTC GCC GGC CGA 
; r < i / i 3 1. 

CGG CCG AGC GCT GT j CGT GGC 
arg pro ^: ala v.: ; r> ; — , : l v 



ACC CGG TCC TGG TCA ACG TCA 
thr arg ser trp ser thr ser 

TGC GCG GTT CCT GTT GCC CGT 
cys ala val pro val ala arg 

CCC TGT TC: ACC AGA AAC GAC 
arg cys cys thr arg asn asp 

CCG GCC CCG GTT GGG CCC CGG 
pro ala pro val gly pro arg 

CGA CCT GGC AAA CTC GCT GGC 
arg pro gly lys leu ala gly 




u:g pre; arg 



SEQ ID N° 36 C 



FIGURE 3 6C 



WO 99/09186 



PCT/FR98/018I3 



111/185 



— J3i/ i jj 

GTC GCC CCC GAA CTA GAC CGC GGG CAA GAG GCC GGC TTT ACC CTC TCG GCC CCG CTG CGC 

val ala pro glu leu asp arg gly gin glu ala gly phe thr leu ser ala pro leu ara 

421/141 451/151 

TCG CTG ACC AGG CCG TCG TTG GCC GTC AAC CAG CCC GGG ATC TAC CCG GTC CTG GTC AAC 

ser leu thr arg pro ser leu ala val asn gin pro gly Ue tyr pro val leu val asn 

481/161 511/171 

GTC AAT GGG ACA CCC GAC TAC GGT GCG CCT GCG CGG CTC GAC AAT GCG CGG TTC CTG TTG 

ctwfa? P " aid arg ieU QSP a3n aia arc ? P he ^ leu 

541/181 571/191 

CCC GTG GTC GGA C;C CCA CCC GAC CAG GCC ACC GAC TTC GGC FCC 3CT GTT GCA CCA GAA 

pro val val gly val pro pro asp gin ala thr asp phe gly sar ala val ala pro glu 

601/201 631/211 

ACG ACG GCG CCG GTC TGG ATC ACC ATG CTG TGG CCG CTG GCC GAC CGG CCC CGC TTG GCC 

^f^f P " Vdl Urp iie thr rnet " Jeu tr P ? ro leu ala * = P ^g Pre arg leu ala 
bbl/22L 691/23: 

CCC GGG. GCA CCC GGT GGC ACC GTT CCC GTC CGG :TG GTC GAC 3 AC GAC CTC GCA AAC TCG 

r ° ^ L > T ala ? X V r — vaI val arg leu val asp ^p asp lea a la aVn ser 



a^a pr: gly gly thr val cro val arg leu - » ' a n -..^ i ^ 

721/241 Vbl/CS: 

: ^ C Cr ' G CT:; GAC ATC CT - "'CG CCG GCC JAG TTC GCC ACC AAC CGG 

ai f «n ^/ gly arg leu asp il, lei >a ser ala ala ;lu pno ala thr asn arg 

/dl/..bi 511/271 

.C CC: GAC CGC GCC GTC CGC CGA GCG CTG TGC CTG GCC ATC CAC CCA CAT CTA 

f^™' " ? ?r ° a5p ^ly ala val gly arg ala leu cys leu ala He asp pro asp I. a 

8tl/*.0i 971/291 

CTC ATC ACC GTC AAT GCG ATC ACC GGC G Z'Z TAC GTC GTC GA'" T'"'G ^CC ^\<~ CC^ 

leu thr v, asn ala no: thr gly gly tyr val v, 1 C r p r o 22 Gy a 2,' 

GCT CAA CTA CCG GGC ACC CCG ACC CAC CCG GGC ACC GGC C/~G C'C CC^ ^C"" ' ~^ 

a 1 a Cr.; : a gly C:r a r ^ rh" his n"-- -, ■ ■ a'. V ' 

^ - , - J - - " - 1 ^ - J -* J - 1 ■ j - ■ a * j g * a a ■ i aia ala s e 

a dI / 22 1 a "i 1 / T3 1 



^ * , -' 1 - J •-•J J ^w-j C i G a C CAC CCG A -A TCG 

leu ar.o a r 7 lea ara :-.r j ea val his a--i 

22c. 2...^. '. . . 22 2^ 

ala asp leu as a ala ieu arg v ■] ] as*- • - - ■■ 



r trp 

■;: caa 



: - a '.' \\ i . 



WO 99/09186 



PCT/FR9S/01813 



112/185 



GAC GCC TTG GGC GCA ATG CTG TGG CGC AGC TTG GAG CCG AAT GCC GCG CCC CGT ACC CAA 

"P^ T leu gly ala met leu tr P ar <? ser leu glu pro a 5 n ala ala pro arg thr gin 
1501/501 1531/511 

ATC CTG GTG CCG CCG GCG TCG TGG AGC CTG GCC AGC GAC GAC GCG CAG GTC ATC CTG ACC 

lie leu val pro pro ala ser trp ser leu ala ser asp asp ala gin val He leu thr 

1561/521 KQ1/r. o 1 



1561/521 1591/531 

GCG CTG GCC ACC GCC ATC CGG TCT GGC CTG GCC GT j CCG CGA CCA CTA CCG GCG GTG ATC 

?i a wr^ aU dld ile Ser gly leU aia val P ro ^ pro ala val lie 

1621/541 1651/551 

GCT GAC GCC GCG GCC CGC ACC GAG CCA CCG GAA CCC CCG GGC GCT TAG AG " GCC G~T CC 

?inwc P / la thz qiu Pr ° pr0 glu 3 ] V ^ ser ala ala arg 

1 6 8 1 / 5 o . 1711/5 71 

GGC CGG TTC AAT GAC GAC AT : ACC ACG CAG ATC GGC GGG CAG GTT GCC CGG CTA TGG AAG 

gly arg phe asn asp asp ile thr tihr gin ile ? Ly gly glr. val aia ar< T leu -o iw 3 
i / \l I b 8 1 17 7i / 5 ^ 1 3 

CTG ACC TCG GCG TTG ACC AT J GAT GAC CGC ACC GGG CTG ACC GGC GTG CAG TAG ACC GC\ 

leu thr ser aia leu thr il- aso aso a:q -h*- i o-, - ^ >■ *< T1 J'*' 

Jv - /o0i i a 3 1 / 6 1 1 

CCA CTA CG: GAG GAC ATG TT ; CGC GCG CTG AGC CAA TCG CTA CCA CCC G-YT ACC a ^ 

pro leu arg giu aso .e: lea arg ala leu .er jl r. ser leu oro ,ro aso thr ara asn 
18^1/oCl 1091/631 * ' 

• 3 f T ^ G ? C C * G CGG C7G GCC GTC GTT GGA ^ G ACG ATC GAC CAT CTT TTC GGC GCG 

^V" ,J 1 ar ' 3 i0 ' : Vai Va: ^ ^ -«P leu phe giy ala 

I3^1/6nl 1951/651 

GTG ACC ATC GTC AAC CCG GGC GGC TCC TAG ACT "TG GCC ACC GAG 7 AC AGT CCG CT 



val thr lie vai asn oro civ gly ser tvr thr ,=> ■ - n - - ^ rr . . 

■ - - J J - LI '^ • " ! — - -iis ser pro ieu pro 

i981 /6ol . 20u -G7l 

TTG GCG CTG CAT AAT GGC CTC GCC GTG CCA AT C CGG GTC CGG CTA CAG G-v -v^ 



-u aia leu 



C.A C.-\G GTC GAT GCT CC 

, n . W c' " ' """" ' pr ° lIe Vd: ar; ? lcu - lr * val as:; ala or 

;ici/7 ;i ^" ^"^ < "'* .I'i:'-^"" p: " J ' : " ; ;:y * y: ?ro L ' : 

arg val pro : 1 -a qL\: va 1 a;,:, oh-,, th: :j 1 r. -->ag , , . \ f \"'' ^ ~ 



WO 99/09186 



PCT/FR98/01813 



113/185 



ORF d'apres Cole et al . , 1990 (Nature 393 537- 54 4) et contenant Rv 3909. 

1/1 31/11 

TGA CTC AGC ACC GGG TCA GCA CAA CGG TCC CGG CCC GGG GCC GTG ACC GCA CTG CAA CTC 

OPA leu ser thr gly ser ala gin arg ser arg ala gly ala val thr ala leu gin leu 

61/21 93/31 

GGC TGG GCC GCT TTG GCG CGC GTC ACC TCA GCG ATC GGC GTC GTG GCC GGC CTC GGG ATG 

leu aia arg vai ^ ^ ^ ^ ^ ^ ^ ^ ^ 



gly trp ala ala 
121/41 



> 1 / 5 1 



3CG CTC ACG GTA CCG TCG GCG GCA CCG CAC GCG CTC GCA GGC GAG CCC AGC CCG ACG CCT 
ala leu thr va, pro ser ala ala pro hi. al, !,m ala gly glu pro ser pro thr pro 



TTT GTC CAG GTC CGC ATC GAT CAG GTG ACC CCG GAC GTG GTG ACP nrr rr( 
Sue vdi yir; val arg lit? aso air. vai thr 
341/31 



val val thr thr 

27 ^ 



g 1 u pro 



CAT GTC ACC GTC AGC GGA ACG GTG ACC AAT AC.- ™ G A ' ^ " G C"A r T - 
.lis val tnr va^ cer qiy tn: val thr a:.:: th: *'v a*-" 

3c:/ioi " , > ~ ' ' " ; 



val arg aso va. 



val arg lev: glu hi. a", a ala ala val thr s-r - 
351/121 r<: 



"G: ACC TCG CTC GAC 
:ir^ thr ser leu asr; 



-^'o 'o^, ij^O .J/ 



giggly thr asp gin rye gin pro ala ala asp phe 1 <er-G Vhr v,L ^ gin asp 



421/141 

CGC GGG CAA GAG CCC. 3r,C TTT ACC CTC TCG GCC CCG CTG CGC TCG CTG ACC AGG CCG TCG 

arg ■: . y g.r. .;l u ,jl y p.:, th: ! <>•.> ,-: p., : ( . u , :: itM . thr 3r . prQ .... 

T " CT ' :; ' r — G 7f: AAT GGG AC A CCC GAC 



181/ 161 

:TG GCC GTC AAC CAG CCC GGG ATC TAC CC 



v. 



5 41/1 -i 1 
TAC GG7 GCG 



0G1/2.M 



WO 99/09186 



PCT/FR98/01813 



114/185 



1021/341 1051/351 

CTA GTC CAC CGG ACA TGC GTG ACG CCG CTG CCT TTT GCC CAA GCC GAC CTG GAT GCT TTG 
leu val his arg thr cys val thr pro leu pro phe ala gin ala asp leu asp ala leu 
1091/361 1111/371 

CAG CGG GTT AAT GAT CCG AGG CTG AGC GCG ATC GCA ACC ATC AGC CCC GCC GAC ATC GTC 
gin arg val asn asp pro arg leu ser ala ile ala thr ile ser pro ala asp lie val 
1141/381 1171/391 

GAC CGC ATC CTG GAT GTC AGC TCC ACC CGC GGC GCA ACC GTG CTG CCC GAC GGC CCG TTG 
asp arg lie leu asp val ser ser thr arg gly ala thr val leu r>ro asp qly pro i eu 

ACC GG: CGJ GCG ATC AAC TTG CTC AGC ACC CAC GGC A AC ACG GTT GCC GTC GCG GCC G~C 

thr gly arg ala ile asn leu leu ser thr h ; 3 g 1 - 
1261/421 L2-31/43; 

GAT TTT AG? CCC GAG r,AA CAG CAC GGT TCG CCC '.aj 

as? phe ser pro glu glu gin gin gly ser :>-r 7 i n u e glv ser ala leu leu pro 
132./M1 1 1351 '45: 

AC „ C - CG J ^ j j TTG TCC CCC CGG GTG GTA 

thr a La pr: arg arg leu ser; oro arg va i va' 
1 2 3 1 / 4 f 5 1 * m ; i 

GCC GCG CTG GCC GCC GCG GGA ACA AAC CCG ACC < 

ala ala leu ala ala ala gly thr asn pro thr \ 

i^iiMdi " 

TTC GTT CGG ATC GCG CAT GAA TCG ATC ACC GCG CGC CCC CAG GAC GCC TTG GGC CCA AT 

phe val arg ile U his glu ser ile thr ala arg atcj oln uso ala leu gly ala 
1531/501 i sv ■ 



a s a t h i val ala val ala ala ala 

ATC oGC TCC GCG CTC TTA CI 



TTT GAT CCC GCG GTC GGC 
p h c a r, p pro a 1 -i v 1 1 g ^ y 



leu a s d pro s 



met 



■~ i G ;GG AGC TTG GAG CCG AAT GCC GCG CCC CGT AC 7 

leu trp arg ser leu glu pro asn ala ala :>;.> : -g *'•■• - 
1-51/5:21 1 571/ 531 

TCG TGG AGC CTG GCC AGC GAC G A C GCG o; ' AC """ ""G 

ser trp sc: leu :ila ser asp as:: ala : r. v . 1 

1C21/541 ' ' . 

thr giu pro pro glu pro pro glv a lei tv: » ; ; : : i > • - 

17 1 1/53 1 ....... 



- C 7 j GT G CCG C C G G C G 

e :ou val pro pro ala 

G CTG GCC ACC GCC AT C 

a leu ala thr a .. a : 1 o 



WO 99/09186 



PCT/FR98/018I3 



115/185 



2041/681 2071/691 

CTC GCC GTG CCA ATC CGG GTC CGG CTA CAG GTC GAT GCT CCG CCC GGG ATG ACG GTG GCC 

J?nwi«/ al Pr ° Vai 3rg iGU gln Vai dSp aia pro pro 9ly met thr val did 

2101/701 2131/711 

GAT GTC GGT CAG ATC GAG CTA CCG CCC GGG TAC CTG CCG CTA CGA GTA CCA ATC GAG GTG 
asp val gly gin lie glu leu pro pro gly tyr leu pro leu drg val pro lie glu val 
2161/721 2191/731 

AAC TTC ACA CAG CGG GTT GCC GTC GAC GTG TCG CTG CGG ACC CCC GAC GGC GT- G~G CT^ 
asn phe thr gin arg val ala val asp val ser leu arg thr pro asp gly val ala leu 
J 2 21/741 2251/7 5] 

GGT GAA CCG GTG CGG TTG TCG GTG CAC TCC AAC^GCc'tAC GGC AAG GTG TTG TTC GCG AT C 
gly glu pro val arg leu ser val his ser asn ala tyr jly lys val leu ph- ala 
2281/761 2 3 1 1 / 7 7 1 

ACG CTA TCC GCT GCG nrr GTG CTC CTA ACG CT^CCC^, CGG JGC CTT TGG CAC CGG TTC 

;^^ Ser aia ala ala vaI leu Vdl t: - ^ yly arg arg leu trp his ara phe 

^34 1/78 1 237 1 /7 9 1 * 

CGT GGC CAG CCT GAT CGC GCC GAC CTG GAT CCC CCC GAC CTG CCT ACC GGC AAA CAC GC~ 

arg g.y glr: pro asp arg ala asp leu asp arg pro as:; leu oro th- oW 1 s i- s r , 

2401/601 2431 '311 ' " * 

CCG CAG CGC CGT GCC GTA GCC AGT CGG GAT GAC GAA AAG CAC CGG GTA TGA 



prD gin arg arg ala val ala ser arg asp asp 



j PA 



SEQ ID 36F (suite 2) 
FIGURE 36F (suite 2) 



31/11 



i is ser 
I ? 1/4 1 



^ : o ri s r: 



r. i , •? rue * aia a s o t n 



■a rr-> a ,i : 



W O 99/09186 



PCT/FR98/01813 



116/185 



l/l 

GAT CCG CGC GTT GGC GTC GCA 

asp pro arg val gly val ala 
61/21 

GCA CAG CGG CGC CCA AAT CAT 

ala gin arg arg pro asn his 
121/41 

GCT CAA OCT GCC CTG GCT GGC 

ala gin pro ala leu ala gly 

:bj /6j 

ggc agc cgg gca gct tcg ag a 

gly ser arg ala ala ser arg 
2 41/81 

C.CC CAA GAT C 
pro gin asp 



31/11 

TCC GAA CAT CGT CGG AGT 
ser glu his arg arg ser 
91/31 

GGC CGA CAC CGG ACT GGC 
gly arg his arg thr gly 
lbl/bl 

CAT GGG CGC CAC GGG CTT 
his gly arg his gly leu 

211/71 
GTT GTT GTC CGZ CTT CGG 
val val val arg leu arg 



SEQ ID N° 37B 
FIGURK 37B 



CAA GGA CGC CAA AGC CGA CCT 
gin gly arg gl n ser arg pro 

CTA CTA TTC CGG CGA CGA CGC 
leu leu phe arg arg arg arg 

CAT CAG CGT GAT TGC CCA CCT 
his gin arg asp cys pro pro 

TTC TGG GGA TAT CGC CAC CGC 
phe trp gly tyr arg his arg 




SZQ 10 N 1 37C 



WO 99/09186 



PCT7FR98/01813 



117/105 



Sequence codante Rv2753c pre^ir. par Cole et al., 1990 (Nature 3^3 537-544) 
contenant Seq 37A 

1/1 31/11 

GTG ACC ACC GTC GGA TTC GAC GTC GCA GCG CGC CTA GGA ACC CTG CTG ACC GCG ATG GTG 
val thr thr val gly phe asp val ala ala arg leu gly thr leu leu thr ala met val 
61/21 91/31 

ACA CCG TTT AGC GGC GAT GGC TCC CTG GAC ACC GCC ACC GCG GCG CGG CTG GCC AAC CAC 
thr pro phe ser gly asp gly ser leu asp thr ala thr ala ala arg leu ala asn his 
121/41 151/51 

CTG GTC GAT CAG GGG TGC GAC GGT CTG GTG GTC TCG GGC ACC ACC GG Z GAG TCG CCG ACC 
leu val asp g^n gly cys asp gly leu val v*l gly «hr thr gly glu ser pro thr 

181/61 2 11/71 

ACC ACC GAC GGG GAG AAA ATC GAG CTG CTG CGG GCC GTC TCG GAA GCG GTG GGG GAC CGG 
tnr thr asp gly glu lys ilo glu leu leu .acq ala val leu qlu ala val alv ,,r, >^ 

0 1 / Q T , , , '- J *- - - ^ 



AGC ATC CGG CT G GCC AAG 
ser ;le arg 1 e .i ala 1 vs 



211/91 t -? ■> / 9 ■ 

G JZ CgT G IT AT- GCC GGT GCC GGC ACC TAT CtAC ACC 

ala arg val lie ala gly ala jly thr tvr as:: th: 
331/101 ' ' ' 3j1/111 

GCT TGT GCG GCC 3 A G GGT GCG CAC GGG CTG CT., G 1 G 

ala :y3 ala ala glu gly ala his gly l,:u val val tar arc tyr tyr ^ 1*^ o-o 

361/121 391/131 ' 

'-'-j ^A'j C j ..j GGG JV : _> CAA GCC CAC TTC ACC GCG GC 

pra -jln arg gly lea gin ala his oho thr ala val 
-12 1/14 1 4 1 / 1 5 L 

CTG CTC TAT GAC ATC CCG GGG CGG TCG GCG GTG CCG AT V GAG CCC GAC ACG A^ CG - r — 

leu leu tyr asp lie pro gly arg ser ala val u :. a glu pro a'sp thr lie arg ala 

'1 0 1 / 1 C 1 1 ' i 7 ' 



GCG ACC GAG CTG CCG ATG 
ala thr glu leu nro r.e: 



T m G G'^G T^a r-.»" ^ - - ~- . . , — . 

leu ala ser nis pro aari i 1 >- va 1 alv val 

541/191 

GCC CAA ATC ATG GCC GAC A.CC GG*\ :"""G G~"~~ 



'■- ~ GA'... CTG CAC AGC GGC 
i : i asp leu his ser c;lv 



WO 99/09186 



PCT/FR98/01813 



118/185 



ORP d'aprcs Cole et al . , 1990 (N'atuie 393 537-^4) contenant Kv27b3c 
1/1 31/11 

TAA GGT GAG CGC CGT GGC CGA GAC CGC GCC GCT GCG CGT GCA ACT GAT CGC CAA GAC CGA 
OCH gly glu arg arg gly arg asp arg ala ala ala arg ala thr asp arg gin asp acq 
61/21 91/ 31 

CTT CTT GGC CCC ACC CGA CGT GCC CTG GAC CAC CGA CGC CGA CGG CGG ACC CGC GCT GGT 
leu leu gly pro thr arg arg ala leu asp his arg arg arg arg arg Lhr arg ala qly 
121/41 151/bl 

CGA GTT CGC CGG CCG GGC CTG CTA TCA GAG CTG GTC 1AA GCC CAA TCC CAA GAC CGC CAC 
arq val arq org pro gly leu leu ser glu K-u rjln ala gin ser gl;i asp arg hxn 

181/61 211/71 

CAA CGC CGG CTA CCT CCG GCA CAT CAT CGA CGT CGG AC A TTT 2TC GGT GCT AGA GCA TGC 
gin arg arg leu pro pro ala his his arg ,i r g a-; ~hr ohe Leu gly ala a -a Ud r«- 
211/91 1 : i ■ 3 t ' " ' ~ * ' ' 

CAG CGT GTC GTT CTA CAT CAC CGG GAT CTC GCg' ATC «TG CAC JCA CGA GCT GAT CCS CCA 
: Un arg va. vaL leu p. is his arg asp Leu ,1 i .1 il- val hin nro arq ala ass r-ro pro 

.> 01/101 3 "i 1, 1 : ; ' ' ' 

CCG GCA TTT CTC CTA :TC GCA JCT CTC CCA CCG CTA CGT ACC TCA CAA GGA CTC 

pro ala pue Leu leu leu ala ala leu ore ala leu 



rg Lhr arg glu gly leu ala gl 



3 61/121 VU/ 131 

■_GT CjT GCC CCC CGG CAT 3GA 3GA CGA CGC CGA CCT GCG CCA -""AT CCT jAC CGA GG " 

arg arg ala all arg ;:;s gly gly arq arg arg pro ala pro -jro ...so arg glv arq 

•52 1/14 1 ^ i , 15i * ' ■' ^ 

CGA CGC CGC CCG CGC CAC 2TA CAG CGA GCT GCT GGC CAA GCT "1GA AGO CAA 3TT CGC CGA 

arg arg arg pro arg his leu g.ln arg ala ala gly ct 1 n ala gly ser gin val arq arq 

'"'31/161 511/ 171 ' ^ 

pro thr gin arg asp pro ala oro gin ala giy pro r-ro :;er ctrg ore arg iilv ti \* f Va 
L -5 1 / 1 6 1 y ; • , , • ' ' 

•r. 01/201 ' ' - ,.'.■>"".' ' ' 



WO 99/09186 



PCT/FR98/01813 



119/185 



1021/341 1051/351 

GAC GGG GAG AAA ATC GAG CTG CTG CGG GCC GTC TTG GAA GCG GTG GGG GAC CGG GCC CGT 
asp gly glu lys lie glu leu leu arg ala val leu glu ala val gly asp arc: ala a ro 
1081/361 1111/371 ^ 

GTT ATC GCC GGT GCC GGC ACC TAT GAC ACC GCG CAC AGC ATC CGG CTG GCC AAG GCT TGT 
val ile ala gly ala gly thr tyr asp thr ala his ser ile arg leu ala lys ala cvs 
1141/381 1171/391 

GCG GCC GAG GGT GCG CAC GGG CTG CTG GTG GTC ACG CCC TAC TAT TCC AAG CCG CCG CAG 
ala aid glu gly ala his gly leu leu val val thr pro tyr tyr ser lys p-c pro qln 
1201/401 1231/411 

CGG GGG CTG CAA GCC CAT TTC ACC GCC GTC GCC GAC GCG ACC GAG CTG CCG ATG CTG CTC 
arq gly leu qln ala his phe thr ala val ala asp ala thr glu leu pro met leu leu 
1261/421 12 91/431 

TAT GAC ATC CCG GGG CGG TCG GCG r^ r . rr Z ry;- JA3 ^ AC Ac ~ ATC CG , G _ ??G ^ 

tyr asp lie pro gly dig ser ala val prn ile jlu pro asp thr ile arg ah leu ala 
1321/4 41 13 51/451 

TCG CAT CCG AA 2 ATC 3TC GGA GT 2 AAG GA 2 GCC AAA GCC GAC CTG CAC AG Z GGC GCC CAA 
ser nis pro asn lie val gly val lys asp ala lys ala asp leu ais ser glv al:i q 1 n 
1 3 e 1 / 4 o 1 14 11 '4/1 

ATC ATG GCC GAC ACC GGA CTG GCC TAC TAT TCC GGC GAC GAC GCG CTC AAC CTG CC2 TGG 
lie met ala asp thr gly leu ala tyr tyr ser gly us;) asr: 3 1 a leu asn le- srD t-o 
1441 '461 14 71/4 ?1 

CTG CCC ATG GGC GCC ACG GGC TTC ATC AGC GTG ATT GCC CAC CTG GCA GCC GGG CAG CTT 
leu ala met gly ala thr gly phe ile ser val lie ala his leu ala ala gi v ghi le- 
15C1/501 1531/oH * 

CGA GAG TTG TTG TCC GCC TTC GGT TCT GGG G." T ATC GCC ACC GCC CGC AAG ATC AAC ATT 
arg glu leu leu ser ala phe gly ser: gly asp ,ie ala thr ala arg lys ile asn jl e 
l^VSCl . 1 SO 1 /' S 3 1 

GCG GTC GCC CCG CTG TGG AAG GCG ATG AGC GCG CTG GGG GGC GTG ACG TTG TCC AAG GCG 
did val ala pro leu -ys asn ala r.et ser arg leu qlv glv -;a . th- 1 — 1 • - a 1 j 

'541 1^;,1 's ;i ' 

u^--.- a ^a U'.jG C-G CAG GGG A2C GAG GT'C GCT GAT G 



_u a r ? 1 eu glu g !. y lie asp val. gly as:; : r a: 



Sri (2) 1 L3 i: 1 37? (cillVo 1) 
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l/i 

GCG GTG AAC TGG TGG GCC CGG 
ala val asn trp trp ala arg 
61/21 

AGA CGA CGG ATG GAA GGA GAT 
arg arg arg met glu gly asp 
121/41 

TCG TCG TCT ACG GAG GTG AAG 
ser aer aer thr glu val lys 
181/61 

ACT GGC CCG CAG GTG AAG GCG 
thr gly pro gin val lys ala 
241/81 

GAC GCG TGC CCA GAA CAG GCC 
asp ala cys pro glu gin ala 
301/101 

CTT GTT GGC ATT GCG GCG ACG 
leu val gly lie ala ala thr 

3 61/12 l 

TTT GCG TTG CGC TCA CAC CAG 
phe ala leu arg ser his gin 
421/14 1 

GAG GCC GCT AAG GAT TGC GTT 
glu ala ala lys asp cvs val 
481/161 
AGC ATG CAG AAG ATC 
ser rr.et gin lys lie 



31/11 

ATG GTT CAA GTA CGC CGT 
met val gin val arg arg 
91/31 

GCT GGC GCC GGC CAG CTG 
ala gly ala gly gin leu 
151/51 

GCG GCG GAT TCG GCG GAA 
ala ala asp ser ala glu 
211/71 

GCG GAT TCG GCG GAA TCT 
ala asp scr ala glu ser 
271/01 

CTC GTC GAG CGG CGC CjG 
leu val glu arg arg pro 

331/111 
CTG CTC GCG TTG GCC CGT 
leu ala luu aid ;/ L y 

391/131 
GAA AGC CAA TCA ATC GCG 
glu ser gin ser lie ala 

45 1/151 
GCG GCC ACG CAS GCA CCC 
ala ala thr gin ala pro 



CGC AAA CTC GAG CAC AAC AGG 
arg lys leu glu his asn arg 

AAC CCT GCC GAT GCG AAT AAG 
asn pro ala asp ala asn lys 

TCT GAC GCC GGA GCC GAC CAG 
ser asp ala gly ala asp gin 

CAC GCC GGA GAG CTC GGC GAG 
asp ala gly glu leu gly glu 

TCG CGG TTG CGG CGA GGC TGG 
ser arg leu arg arg gly trp 

GGC CTT GGC GCA GTG GCT TAT 
gly leu gly ala ala gly tyr 

CGC GAG GAC CTT GCG GCC ATT 
arg r^lu a;ip leu ala ala lie 

GAT GCT GGG GCG ATG TCG GCT 
asp ala gly ala met ser ala 



SEQ ID N° 38A 
FIGURE 38A 
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1/1 31/n 

AGC GGT GAA CTG GTG GGC CCG GAT GGT TCA ACT ACG CCG TCG CAA ACT CGA GCA CAA CAG 

sec gly glu leu val gly pro a 3 p gly sec sec tlu pro ser gin the arg ala gin gin 
61/21 91/31 

GAG ACG ACG GAT GGA AGG AGA TGC TGG CGC CGG CCA GCT GAA CCC TGC CGA TGC GAA TAA 

glu the .he asp gly arg arg cy.s t rp ary arg pro gl u pro cys lu 0CH 
121/41 151/51 

GTC GTC GTC TAC GGA GGT GAA GGC GGC GGA T'I'C GGC GGA ATC TGA CGC CGG AGC "GA CCA 

.81/61 V " 9lV PhC alV gly lle 0PA ^ arg ser arg pro 



\CC To A CGC CGG AGA GCT CGG no A 

arg arg arg ala arg arg 

V : GTC GCG GTT GCG GCG AGG CTG 

V ^ Pf ° ^ arg arg a 1 a a ; a v, 1 ala val ala ala arg leu 

/vuC G C 



3AC TGG CCC GCA GGT GAA GGC GGC GGA TTC G ; 
asp trp pro ala gly glu gly glv aly p 1 -- - 1 < r 

t x / O J. 9*71 

GGA CGC GTG CCC AGA AC A GGC CCT CGT CGA GC* 

3oi/:ci -3 j. 

GCT TGT TGG CAT TGC GGC GAC GCT GCT CGC ^ rT, ~ 

ala cys tr ? ,, , cys gly asp ala al, val ^ t Z ^ ^ C, ^ glv il 

TTT TGC GTT GCG rT C A'" A rr s - - - — • — ■ 

, v - ... u^-'-j ^u.n bo/\ wCT . GC GGC A 

pne cys val ala leu t_hr pro a 1 ^ ^-^ n-n — < ■> * - i < " 

421/ih 1 7 " " JJ p ;C/C'' - a drg q - y ?ro Ci ' s 

^ ^ ^ ™ T?G CG? TG= GGC CAC - ' ^ ■ TGG jGC GAT GTC GGC 

OP/\ gly arg OCn gly :eu arcj cvr, n : ., .. .. . K , 

481/161 ' " " ' - r 3^ as P val -7lV 

TAG CAT GCA GAA GAT C 
.AM 3 hi 3 ala ah: asrj 



FT OUR K 
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Sequence Rv0173 predite par Cole et al., 1996 (Nature 393 537-544) et contenan 
seq38A 

1/1 31/11 

GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GCC GAC CAG ACT GGC CCG CAG GTG 
val lys ala ala asp ser ala glu ser asp ala gly ala asp gin thr gly pro gin val 
61/21 91/31 

AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GAG CTC GGC GAG GAC GCG TGC CCA GAA 
lys ala ala asp ser ala glu ser asp ala qiy glu leu gly glu asp ala cys pro alu 
121/41 151/51 

CAG GCC CTC GTC GAG CGG CGC CCG TCG CGG TTG CGG CCA GGC TGG CTT GTT GGC ATT GCG 
gin ala leu val glu arg arg pro ser arg leu arg arg gly t rp leu val gly ile ala 
181/61 211/71 

GCG ACG CTG CTC GCG TTG GCC GGT GGC CTT GX GCA GCG GGT TAT TTT GCG TTG CG^ TCA 
ala thr leu leu ala .leu ala gLy gly leu gly ala ala glv tyr phe ala' lPn ^ 
241/81 Zn/jL 

CA: CAG GAA AGC CAA TCA ATC GCG CGC GAG 3 A C GCG GCC ATT CAG GCC GCT AAG CVT 

nis gin glu ser gin ser lie ala arg glu leu alu ala :le glu ala ala lys asp 

331/101 3]W'r J p 

TGC GTT GCG G C C ACG CAG GCA CCC GAT GCT G >G CCG ATG TGG 3CT AGC AT 3 CAG AAG A T -~ 
cys val ala aid thr glr: ala pro asp ala gly x [ a met ser Ua ser -e- ql- i v *s JV» 
361/121 :v.H/L31 " " 

ATC GAG TGT CGC ACC GGT GAT TTC GGT GCC CAG GCG TCG TTG TAC ACC AG " A'"G ° r "'"^ 
lie glu cys gly thr gly asp pho gly ala uln ala se: leu :yr r.hr s e - rr-t -I" 
421/141 " ' 

GAG GCG TAT CAA GCG GCC AGC GTC CAC GTG CM CTG Acz GAT ATG CGC GCG GC r ' GTC r*r 
glu ala tyr gin ala ala ser val his val gin val thr asp -et Irg ala ala val alu 

481/ie.i :■:;/:';; 

arg asn asn asn asp gly ser val asp val ;,u v,; ala 1,-a arg val ly, val s!- 7s- 
541/181 / ■ 
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ORF d'apres Cole et al . , 1998 (Nature 393 537-544) Contenanr Rv0175 
1/1 31/11 

TGA ACT GGT GGG GCC GGA TGG TGT CAA GTA CGC CGT CGC AAA CTC GAG CAC AAC AGG AGA 
OPA thr gly gly ala gly trp cys gin val arg arg arg lys leu glu his asn arq arq 
ol/21 91/31 

CGA CGG ATG GAA GGA GAT GCT GGC GCC GGC CAG CTG AAC CCT GCC GAT GCG A AT AAG TCG 

arg arg met glu gly asp ala gly ala giy gin leu asn oro ala asp ala as- lys se- 
121/41 151/51 

TCG TCI ACG GAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GCC GAG CAG ACT 

ser ser thr glu val lys ala aia asp ser ala glu ser aso ala gly ala aso gin thr 
181/61 211/71 

GGC CCG CAG GTG AAG GCG GCG GAT TCG G:G GAA TCT GAC 3CC GGA GAG CTC GGC GAG GAC 

qly pro gin val lvs a 1 a * M asp scr ala yiu ser asp ala gly glu leu glv glu asp 
2 4 1 / 8 1 ? 7 1 / 9 1 

GCG TGC CCA GAA CAG GCC CTC GTC GAG CGG CGC CCC TCG CGG TTG CGG CGA GGC TGG CT T 

ala cys pro glu aln ala leu val glu arq arg ors se: a : ; j ieu a rg a-g - ieu 

Cui'lOl 331/111 " 3 - " c 

GTT GGC ATT GCG ^CG ACG CTG IT C GCG TTG GCC GG C GGC CTT GGC CCA GCC GGT TAT TTT 

val gly xle ala ala thr leu ieu ala leu ala gly g : y ieu ala ala giy ryr ph- 

u - 1/ 12 1 391/131 ' 

GCG TTG CGC TCA CAC CAG GAA ACG CAA TCA ATC GCG CGC CAG 3 AC CTT GCG GCC ATT GAG 

ala leu arg ser his gin glu ser }ln ser lie al.i arg qlu asp leu ala ala ile glu 
421/141 451/151 

GCC GCT AAG GAT TGC GTT GCG GCC A3G CAG GCA CCC GAT GCT GGG GCG ATG TCG GCT AGC 

aia ala lys asp oys val ala ala tr.r: gin ..CI a pro aso ala giy aia ir.et ser aifl ser 
4 e 1/161 : 11/ 1C 1 

ATG CAG AAG ATC ATC GAG TGT GGC ACC GCT GAT TTC GGT CCC CAG ' 



rr.et gin lys .: : e ;ie glu cys gly \nr. g^y asp one giy ala gin ala 

54 1/101 c 71/ 19 1 

,'\G^ ACj L*,^ CCC GAG GCG TAT CM GIG GCC AGC GT ; ~' CAC GTG CAG GCG 

ser rr.el. .leu val glu ala tyr gin ala aia rer val h_ o val :!n .v ■ 



: WCG. r a 1 /C3 ! 



1 q v 
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31/11 



ACA CCT 


CCC 


CCC 


CCG 


CCG 


CCG 


CTG 


CCG 


CCG 


GTT CCC 




CCC 


AAG 


GAA 


TGT 


CCG 


GCG 


CCG 


thr pro 
61/21 


pro 


pro 


pro 


pro 


pro 


leu 


pro 


pro 


val pro 
91/31 


phe 


pro 


lys 


gl u 


cys 


pro 


ala 


pro 


GGC GTG 


ATG 


CAA 


GGC 


TGC 


CTT 


GAG 


AGC 


ACC 


AGC GGC 


TTG 


ATC 


ATG 


GGC 


ATC 


GAC 


AGC 


AAG 


gly val 
121/41 


met 


gin 


gly 


cys 


leu 


glu 


ser 


thr 


ser gly 
151/51 


leu 


lie 


met 


gly 


ile 


asp 


ser 


lys 


ACC GCA 


CTG 


GTC 


GCC 


GAG 


CGC 


ATC 


ACC 


GGT 


GCC GTC 


GAG 


GAG 


ATC 












thr ala 


leu 




ala 


al u 


arg 


iie 


thr 


gj y 


ala va 1 


alu 


glu 


lie 













SEQ ID N° 39A 
FIGURE 3 9A 



1/1 

CAC CTC CCC CCC CGC CGC CGC TGC CGC CGG 

his leu pro pro arg a r :j arg cvs arc; arg 
61/21 

GCG TGA TGC AAG GCT GCC TTG AG A GCA CCA 

ala OPA cys lys ala ala leu arg ala p:o 
12 1/41 

CCG CAC TGG TCG CCG AGC GCA TCA CCG GTG 

pro his trp ser pro ser ala ser sro val 



31/11 

TTC CCT TTC CCA AGG A AT GTC CGG CGC CGG 

pr.e pro pr.e pro arg asn val dry arg arg 
91/31 

GCG GCT TGA TCA TGG GCA TCG ACA GCA AGA 

ala al* O PA ser trp ala ser thr aia arg 
151/51 




SEQ ID 3 93 



FIGURE 3 SB 
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seq39A Ce Rv3006 P r6dlte Cole et ai., 199e (Nature 393 537-544) et contenant 

1/1 31/11 

ATG TGG AC A ACG CGG TTG GTT CGA TCC GGA CTC GCC GCG CTG TGC GCG GCA GTG CTG GTA 
Met trp thr thr arg leu val arg ser gly leu ala ala leu cyo ala ala val leu val 

91/31 

TCG AGC GGC TGC GCA CGG TTC AAC GAC GCT CAA TCT CAG CCC TTC ACC ACC GAA CCG GAG 
ser ser gly cys ala arg phe asn a 3 p ala gin 3 er gin pro phe thr thr glu pro qlu 
121/41 151/51 

CTG CGG CCC CAA CCC AGC TCG AC A CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT 
leu arg pro gin pro ser ser thr pro pro pro pro pro cro leu pro pro val pro phe 
181/61 211/71 

CCC AAG GAA TGT CCG GCG CCG GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG 
pro lys glu cya pro ala pro gly val met gin gly C ys leu glu ser thr ser r-ly leu 
2 4 1/9 1 271/91 

ATC ATG GCC ATC GAC AGC AAG ACC GCA CTG GTC GCC GAG c;,e a: C A"C GO" GCC '"TC GAG 
lie ret gly He asp ser lys thr ,1, leu val al. ,,lu ar:; :ie thr Jy ala val glu 
j u i / i u 1 3 3 1/111 

GAG ATC TCT ATC AGC GCC GAG CCG AAG GTA AAG ACT; GTC ATC CCC GTG GAT CCT G'~'~ GGT 
glu lie scr lie ser ala glu pro lys val iy.s thr- v.. : :lo pr-> VJ ' a:;p pro ala city 
3bl/121 391/131 

GAC GGT GGC TTC ATG GAC ATT GTG CTG TCG CCC A::c TA: :t, CAA GAC CGG CTG ATG TAC 
asp gly gly leu met asp lie val leu ser pro tr.r t_yr ae: glu *t>i; arg let: n*r tyr 
421/141 4 5 1/15 1 

GCC TAC ATC AGC AC Z, CCC ACC GAZ AAC CGG GTG GTG CGA G'L\; GCC GAC ( GGG GAC A— CC" 
ala tyr ile ser tnc P :j thr asp asn arg val val ar 7 vil ala a'sii qly Lp Tie pro 
48 l/lo 1 511/171 

AAG GA2 ATC CTG AC Z GGC ATC CCC AAA GGT GCT GCC GGT A*M A^r GGG GCG CTG A"'* TT~ 
^? iie ieU thr ^ L V He prD lys gly ala ala gly a.;; thr gly ala leu lie phe ' 

5 4 1/19 1 57 1/191 

ACC AGT CCC ACC ACG CTG GTC GTG ATG ACC GCG G AT 'v~: GCC GAC CC, — ;- TTG r^ r Gcr 
thr ser pro thr thr lew val val met thr gly aisp ,1 x aly an. ala leu Tla ala 

60 1/2 J 1 r ; i i ? i ^ 

GAT CZC CAA TCG TTG GCC GGT AAG GTC CTC/ CCT ATC \ , - - v" ~* ■ 

asp pro gin ser lea ala gly lys val leu arg ilv ala g 1 :: r - • e ~ 



661/22 1 

ACg C^'j C.,-w ACg ACG GCG CTG TCT GGC ATC G"7 

thr prD pro thr thr ala leu ser glv lie alv 
' 7 2 1 / 2 4 1 ' 

GTC GAC GGG IMG C 1'A TAT GTC GCC CAT C^C ACC 

val asp gly acr lea tyr val ala as;; a: a f.r 
731/261 

ACC AAG AAC TCG GAG GTC TCT AC G GT 
:■ 4 1/231 



691/2 3 1 



■3 : : ' 



<-r\.jQ CAG 

gly gin 



i: g l. 
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OPF d'apres Cole et al . , 1998 (Nature 393 hV- S-M) et contenant Rv3006 
1/1 31/U 

TAA GGC CAT TTA GTG CCG AAT TGG GGA TTT GAG CGG CGC TTT CGC CAG ACA ATC CGC ACA 
OCH gly his leu val pro asn trp gly phe glu ar 3 arg phe arg gin thr Ue arg thr 
ol/21 91/31 

TTG ACC CTG ACC AGC CCA CCA AAA GGC CCC AAT TGG GCC GCC ATG CCG ACA GTG r G r A ~r 
leu thr leu thr ser pro pro lys gly pro asn trp ala ala met pro thr val Ira th- 
121/41 jsi/u 

CCG GCA GGT GGC GGC GAT GCC CAC AAT GTC CGT AG C CTG TCG GTC ATG TGG ACA ACG CGG 
pro ala gly gly gly asp ala his asn val arg ser leu ser val met trp thr thr arg 
18I/6I 211/71 

TIG GTT CGA TCC GGA CTC GCC ZZZ CT 0 TGC GCG GCA G"G " GTA -r-r — --■ 

leu va, .1- ser g.y t «u ala aia leu cyr, a I .\ al., val le, val set ser jly cy S ala 

C. *t 1 / 0 1 ? 7 1 /' H 1 

C33 tt: aac gac gct caa tct gas CC3 ttc acc a:-:: g.aa cc:; GAG CTG CGC r Z r ~rr 

ar, phe asn asp ala 3 ln ser jln pro ph . : • ,, : ?rl leu a pr3 ~; 

■ J L / 1 0 jl 3 1 1 ■ 1 

a;: tc3 aca cct ;cc .cc ccg :cg ccg ctc ccg ccg gtt cc: ttt ccc .aag ga. tg- r C >: 

I:;";; thr pr ° pr ° pr ° ? )ro ?" P™ ^ Pro p;c val pro phe pro lys glu cys crc 

_-■ -j i / 12 1 ■91/13: 

CC3 CCG GGC GTG ATG 3AA GGC 1GC CTT GAG AGC ACC AGC GGC TTG AT C ATG GGC •ATC <:v 

a a pro gly va. «t -gin qly =y. ; leu 3 iu ser v.h; ,er ,iy l,u lIe ne: gly lie ass 

4 - 1/141 -15 1/151 

AGC AAG ACC GCA CTG GTC GCC jAG CGC ATC ACC GGT GCC GTC GAG GAG ATC TCT ATC AGC 

ser lys thr ala leu val ala jlu a:<; i 1 .,1a ,1,; giu U e so: rio ser 

'i 0 i / 1 b . '. 1 ' ' - 7 - 

GCC GAG GCG AAG GTA AAG ACG CTC ATC CCC GCC GA'I CC"" : 

ala glu pro lys val Ivs thr val il t ? r>ro > ; 

Mi/131 ' " :--:i/:«l: ' * 

CAC ATT GT G CTG TCG CCC ACC TAG TCG TAA "A" ^ . 

i ci/20 : * ' 1 J " y ■ 

1 r ' : *" - a r ' P a s n ar:; val \\»1 arg va . a 1 .1 ,t ; 7 



■:j * 1 s ^' 5 - v g y ^ e u : 1 
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Q 61/321 991/331 
GTC TCT ACG GTA TGG ACC TGG CCG GAC 
val ser thr val trp thr trp pro asp 
1021/341 

GGC ACC GTG CTG GTC AAC CTG ATT AAT 
gly thr val leu val asn leu lie asn 
1081/361 

TCG ACC GGT GCG GTC ACC GGA GAA CCC 
ser thr gly ala val thr gly glu pro 
1141/381 

TGG GCA TTA CGG ATG TCG CCG GAC GGC 
trp ala leu arg rr,et ser pro asp gly 
1201/401 

GGC GAC GCC GAG AAG CTC GAC GAT GTG 
gly asp ala ylu lys lev: asp a so val 
12 61/4?: 

■^^■j CG-~. AAC AAC :!jAC GAC AAG ACC TGA 
pro arg dsn asr. asp asn „ly; 3 Lhr CPA 



AAG 
1 ys 


CCC GGC GTG 
pro gly val 
1051/351 


GCC 
ala 


GGG 
gly 


TGT 
cys 


GCC 
ala 


GCG 
ala 


ATG 
met 


GAC 
asp 


ACC 
thr 


AAA CTG ACG 
lys leu thr 
1111/371 


GTG 
val 


GCG 
ala 


GTC 
val 


CGG 
a rg 


CTC 
leu 


GCG 
ala 


CCG 
pro 


GAC 
asp 


GTT GTC CGC 
val va! arg 
1171/391 


AAA 
1 ys 


GAC 
asp 


ACT 
thr 


CAT 
his 


GCG 
ala 


CAT 
hi s 


GCG 
ala 


AAC 
asn 


GT2 TGG GGA 
val trp gly 
1231/411 


GCC 
ala 


ACC 
thr 


GTC 
val 


AAC 
asn 


AAG 
lys 


ACC 
Lhr 


GCC 
a 1 a 


GTG 
va 1 


TTC err, CTC 
phe pro lt.'u 




CCG 
pro 


gin 


GGT 
gly 


GGC 
gly 


GGC 

M 1 t t 

-n ^ J 


TTC 

phe 



SEQ ID N° 39F (suite) 
FIGURE 39F (suite) 
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1/1 

AAG GCC TTG TTG AGC CGG CGC ACG AAA ACG 
lys ala leu leu ser arg arg thr lys thr 
61/21 

CGG TTG AAC GTG TAT GTG CCC GAC GAA TTG 
arg leu asn val tyr va 1 pro asp glu leu 
121/41 

GTC TCG GCG CTG ACT CAG GCC GCG ATC AGT 
val ser ala leu thr gin ala ala ile ser 
181/61 

TGG CT1 GAG GGG TTG GAA CCC AGA AGC ACC 
trp leu qlu gly leu glu pro arg ser thr 
241/81 

ATC GAT GCC GCT CGC GAT GAG TTC GAA GCG 

ile asp a]. a ala arn .^p qi- 

301/101 

AGG TCG TCC TCG ACG CGA GTG CCA TGG TGG 
arg trp ser ser thr arg val pro trp trp 



31/11 

ATC GTT GTG TGT AC A TTG GTG TGT ATG GCT 
ile val val cys thr leu val cys met ala 
91/31 

GCG GAG CGC GCC AGG GCG CGG GGC TTG AAC 
ala glu arg ala arg ala arg gly leu asn 
151/51 

GCC GAG TTG GAG AAC TCC GCA ACC GAT GCG 
ala glu leu glu asn ser ala thr a.sp ala 
211/71 

GGC GCT CGG CAT GAT GAC GTG CTG GCT GCG 
gly ala arg his asp asp val leu qly ala 
271/91 

TGA GAG CAT CGC CCA CTT CGC CGC rr.r. pre 
0?A giu his arq pro leu arg arg a r q ser 
331/111 
ATC 



SEQ ID N° 40B 
FIGURE 40B 



WO 99/09186 



PCT/FR98/01813 



129/185 



Sequence codante Rv0549 
contenant seq40A 



c predue par Cole et al . , 1 993 (Nature 393 : 537- 544 ) et 



1/1 

gtg aga 
val arg 
61/21 
gat eta 
asp leu 
121/41 
gcg atg 
a 1 a me t 
181/61 
cgc gec 
arg al a 
2 41/31 
C13 gtg 
pro val 
301/101 
etc cgc 
leu arg 
361/121 
acc a c c 
thr thr 



gca teg 
ala ser 

ctg get 
leu ala 

cac gcg 
his ala 

ggc gca 
g 1 y ala 

act cga 
thr arg 

ctg ac: 



ccc act 
pro thr 

cgc act 
arg thr 

ccg gcg 
pro ala 

etc acc 
leu thr 

cac ggt 
his gly 

gat gee 
a s p a 1 a 

aga 1 1 g 
arc 1 e u 



teg ccg 
ser pro 

age gat 
ser asp 

cac ttc 
his phe 

gtt gec 
val ala 

ctt teg 
leu ser 

etc tac 
leu tyr 

qca cgc 
ala a r q 



ccg gag 
pro glu 

egg tgc 
arg cys 

gat gca 
asp ala 

tat g t c 
tyr val 

teg ctg 
ser leu 

gtc gag 
val glu 

ccc tg:; 
ala tri! 



31/11 
cag gtg 
gin val 
91/31 
tct gcg 
ser ala 
151/51 
gag gtg 
g lu va 1 
211/7 1 
gat gcg 
a s :> ala 



j. e u a i 
3 ? 1 / 1 3 



gtc gtc gac gcg agt gec 
val val asp ala ser ala 

gtg cgc gcg egg ctg get 
val a eg ala arg leu ala 

ttg teg gcg ctg gag cgc 
leu ser ala leu gly arg 

oca ctg gag gag ttg cga 
ala leu qlu glu leu aig 

gja g::g tgg teg cgc cgc 
g 1 y ala t r p ser arg arg 



:;aa a eg qca ggt ctg gtg 

q i u t h r a 1 a g 1 y leu va 1 

" " «"■'. gee ate ggc tga 

^ - - J . :i:s ala ile gly OPA 



atg gtg 
met val 

egg acc 
arg thr 

atg cag 
met gin 

cag gtg 

a ] n \ra 1 

gac acc 
a s p thr 

' rg ttg 

i e u leu 



SEQ ID N° 40D 
FIGURK 4 0D 



WO 99/09186 



PCT/FR98/01813 



130/185 



31/11 

CCT G( 
pro gl 
61/21 



121/41 
CGT CGT 
arg arg 
181/61 
GGT GTG 
gly val 
2 4 1/81 
GCC TTG 
ala leu 



CGG 


GAC 


GCC 


TAG 


GTG 


TAG 


CCC 


GCG 


GCT AGC 


ACA 


GGA 


TAG 


CCA 


TTG 


TTG 


TGC 


GGT 


arg 


asp 


ala 


tyr 


val 


AMB 


pro 


ala 


ala ser 


thr 


gly 


AMB 


pro 


leu 


leu 


cys 


gly 


















91/31 














AAA 


ACG 


ATC 


AGC 


CCT 


TCG 


CGG 


ACA 


TGT CAG 


CAC 


CCG 


CCT 


TGG 


CCG 


GGA 


GAG 


CGG 


lys 


thr 


ile 


ser 


pro 


ser 


arg 


thr 


cys gin 


his 


pro 


pro 


trp 


pro 


gly 


glu 


arg 


















151/51 














GAC 


CGT 


GCT 


GTC 


ACC 


ACG 


TCT 


GGT 


TAG GCT 


CGG 


GGC 


GCG 


GGC 


TGG 


CGC 


GGA 


GGA 


asp 


arg 


ala 


val 


thr 


thr 


ser 


gly 


AMB ala 


a r q 


gly 


ala 


gly 


trp 


arg 


gly 


gly 


















211/71 














TTG 


CGG 


AG G 


ACG 


TGT 


GTT 


GTA 


GTG 


GGG ACG 


G^- O 


GAT 


CGG 


CCG 


TTG 


GAC 


GCC 


TCG 


leu 


arg 


arg 


a rg 


cys 


val 


val 


va 1 


gly thr 

2 71/91 


ala 


a s p 


arg 


pro 


leu 


asp 


ala 


ser 


CGG 


GAC 


TGG 


GCA 


CAC 


err 






- ^ ' ^. OA! 


















arg 


asp 


trp 


ala 


his 


ala 


val 


val 


S f . 1 r I'u: 



















SEQ ID N 3 4 1A 
FIGURE 4 1A 



1/1 

CTG G^e G-j AGG CCT AGC TGT /\GC CC CG" 

leu ala gly thr pro thr cvs ser ore a: ; }• 

61/21 ' ' ' ^ ' "*'';■ 

G^G CCA t\s\:\ CGA TCA CGG CTT CG~" <"z r " v 

ala pro lyr, a :; ser ala leu* a: j ..;ly 

er pro arg leu val \ : 



a), val thr val leu « ' " ""' '* " " " " " ^ Urt " 



181/6: 



WO 99/09186 



PCT/FR98/018I3 



131/185 



1/1 

TGG CCG GGA CGC CTA CGT GTA 
trp pro gly arg leu arg val 
61/21 

CGC CAA AAC GAT CAG CCC TTC 

arg gin asn asp qln pro phe 
121/41 

TCG TGA CCG TGC TGT CAC CAC 

ser OPA pro cys cys his his 
181/61 

TGT GTT GCG GAG GAG GTG TGT 

cys val a la glu glu val cys 
.? 4 1 / 8 1 

CTT GCG GGA CTG GGC AC A CGC 

leu aia qly leu gly thr arg 



31/11 

GCC CGC GGC TAG CAC AGG 
ala arg gly AMB his arg 
91/31 

GCG GAC ATG TCA GCA CCC 
ala asp met ser aid pro 
151/51 

GTC TGG TTA GGC TCG GGG 
val trp leu gly ser gly 
211/71 

TGT AGC GGG GAC GGC GGA 
cys se: qly asp gly gly 

CGT CGT CAG CGA T'J 
arg arg ql:: aiq 



ATA GCC ATT GTT GTG CGG TAG 
ile ala ile val val arg AMB 

GCC TTG GCC GGG AGA GCG GCG 
ala leu ala gly arg ala ala 

CGC GGG CTG GCG CGG AGG AGG 
arq gly leu ala arg arg aig 

TCG GCC GTT GGA CGC CTC GGC 
ser ala val gly arq 1 o > : gly 



SEQ ID N° 41C 
FIGURE 41C 



WO 99/09186 



PCT7FR98/01813 



132/105 



ORF d'apres Cole et al, 1993 (Nature 39 
1/1 

Lag get egg ggc gcg ggc tgg cgc gga gga 
AMB ala arg gly ala gly trp arg gly gly 
61/21 

ggg acg gcg gat egg ccg ttg gac gec teg 
gly thr ala asp arg pro leu asp ala ser 
121/41 

age gat ctg ate etc cac ate gac gag ate 
ser asp leu lie leu his ile asp glu ile 
131/61 

tcz gat acc ggc gtc aac atg ctg ttc acc 
ser asp thr gly val asn rr.et leu phe thr 
241/81 

cac gcg aat teg cag get gac gee gaa gar 
hi s ala asn ser glr. ala asp ala glu asp 
301/101 

ggc gcg cgt tga 
gly ala arg OPA 



3: 537-544) et contenant Rv2975c 
31/11 

ggt gtg ttg egg agg agg Lgt gtt gta gtg 
gly val leu arg arg arg cys val val val 
91/31 

gee ttg egg gac tgg gca cac gec gtc gtc 
ala leu arg asp trp ala his ala val val 
151/51 

aac egg etc aat gtg ttc ccg gtc get gac 
asn arg leu asn val phe pro val ala asp 
211/71 

atg cgt gee :jeg gtc gta gaa get gat ttg 
met arg ala ala val val glu ala asp leu 
— > 1 / f J 1 

g:g gcg egg gtt gcg gec get etc gcg gec 
val ala arg val ala ala ala leu ala ala 



SEQ ID N° 41F 



FIGURE 41F 



WO 99/09186 



PCT/FR98/018I3 



133/185 



361/121 391,13: 

egg ggc ctg ctg gtt ctg ctg gac gcg ttg cgc tec acc ate tgc ggg cag gca cct gec 
arg gly leu leu val leu leu asp ala leu arg ser ihr i\e cys gly gl n ala pro ala 

421/141 451/151 

egg gcg gtc cac gaa ccc teg ccg cgc gcg ttg ccg acc gac acg get acc caa cgc ccc 

arg ala val tyr glu pro ser pro arg ala leu pro thr asp thr ala thr gin arq nm 

481/161 511/171 

gec ccg caa ttc gag gtg atg tat ctg ttg gcg gta tgt gat get gca gcg gcg gac cag 

ala pro gin phe glu val met tyr leu leu ala val cys asp ala ala ala ala asp qln 

541/161 571/191 * ' 

ttg egg gat ega etc: aag gaa ttg ggt gag teg gtg qce ar.c gec get get ccg ccc g- jC 

leu arg asp arg leu lys glu leu gly glu ser val ala lie ala ala ala oro oro aso 

601/201 631/211 

age tae tee gta cac gtc cac acc gac gac gec ggt acc gtg gaa gec gga ttq gc~ 

5f l;,^; SPr Val hiS Vdi - S thr dS P ^ Jiy ala ala val glu ala gly leu ala 

gtg ggg cga gtc age egg ate gtg ate t,:g gcg or- ggt u: ggg acc age gga ttg ccg 

val g ; y arg vai sor arg iic val xio ser ala :,, , (!y g!v rhr ser glv leu DCO 

/ z 1 / ^ 1 1 7 - ^ 1 . ■ i c, i 

], ; C ? ?* g r tgg a f9 c '39 33C cgc gec gtg cr 3 :c , gtc gac ggc gac ggt gec gec 

ala gxy gxy trp thr arg gly arg ala val leu ai, va 1 val asp gly asp gly ala ala 

/ o 1 / <_ o 1 B 1 1 / 2 7 1 

3 ag ctg ttc gec ggg gag ggc gec tgc gtg etc c;a gac gee gtg aea ccg 

glu leu pne ala glv glu gly ala cyr, val leu a::; pro g pro asp ala val thr oc 

8 4 1/231 3 ; , j u - 

gec gec gat ate agt gee cac cag ctg gtg egg go;: gtg gta gac aee ggc gee gcg car 
901/301 1PU Val Val val as ? thr 5^ ^la ala his 

gtg atg gtg ctg ccc aat gge tat 



n t- 



Uaa C],) 



, . - jty gec: ggg tgt acc g-- 

Va ; / r °; Val ^ P ro ^ val ^ > ^ qlu v,l ala gly eye thr ala 



31/321 

gcg ate ggc tgg ggc gtc gac gta g: 
ala ilc gly trp gly val asp val v, 
.021/ 3'i 1 

gee gcg eta gee gta ea': gac gcg c 
il a -ih 1 al a va .1. 1c. .■ "if;:- al a a 1 
1001/ 301 

:gt gec ecc ggt cct tec cgc cac 
i l g a 1 a ala e I v ala : • • • : n : 

11-11- 3 3 1 



.g gtg cag gqg ttg 
■ '■ va 1 n e : v ; 



WO 99/09186 



PCT/FR98/01813 



134/185 

Seq41T comprenant seq 4 IF et seq 4 15 

1/1 31/11 

tta ggc teg ggg cgc ggg ctg gcg egg ayg agg tgt gt t gcg gag gag gtg C gt tgt aqt 
leu gly ser gl y arg gly leu ala arg arg arg cyo val ala glu glu val cys cys ser 

AMB ala arg gly ala gly trp arg gly gly gly val leu arg arg arg cy 3 val val val 
arg leu gly ala arg ala gly ala glu glu val cy 5 cys gly gly gly val leu ms t 
61/21 91/31 H 

ggg gac ggc gga teg gec gtt gga cgc etc ggc ctt gcg gga ctg ggc aca cgc cgt cat 
gly a 3 p gly gly ser ala val gly arq leu gly leu ala gly leu gly th- arg -rq ar~ 

gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala"*val val 
gly arg arg ale gly arg trp thr pro arg pro cys qly rhr.gly h: s thr pro ser -er 
121/41 151/51 

cag cga tct gat cct cca cat cga cga gat caa ccg get caa tqt gtt ccc gg' eg- coi 
gin arg ser asp pro pro his arg arg a 3 p gin pro ala gin cys val pro gly arq OPA 

5 ^ ^n/ 16 llG 3Sp glU 116 aSn 3rg leu d3n vai P he P*° val ala asp 

ala He OPA ser ser thr ser thr arg ser thr gly ser net ry, ser arg 3UI leu thr 
181/61 211/71 

etc cga tac egg cgt caa cat get gtt cac cat gcg rg:: cgc ggt cgt aga age tga ttt 
leu arg tyt arg arg gin his ala val his his ala cys arg gly arg arg 3 er OPA oh» 

ser asp thr gly val a an met leu phe thr n«c arg *;■> ala val val glu ala a,p" leu 
pro pro ala ser thr cys cys ser pro cyo val .,::g AM* : ys leu He cv- 

2',1/ei 271/91 1- ' 

gca cgc gaa tec gca ggc tga cgc cga aga cgt ggc gee c-gt tgc yg.- eg- tc- -~ ~ a - 
ala arg glu pho ala gly OPA arg arg arg arg gly ih qiv cvs gly arg 3<> ; ^ 

his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala ala 

301/101 331/111 

egg cgc gcg ttg aac gga get cgc ggn aac tec ggc gtq ate ctg tec cag a— c— cue 
arg arg ala leu asn gly ala arg gly asr, ser gly val lie >:> 5 » r gin lie lc ./! , ro 
gly ala arg OPA thr glu ieu ala ala thr pro ala C?A ser ey, pro arg aer. cy 3 ala 

ala arg val glu arg ser ser arq al:\ leu a— v ,>■;- M ^ . _ . 

361/ui iArJ"' 9 pro arg 

ggg ate gca gag gtg ace gcg act gcg gee gee grr ::- ggc ? ,- g gta CCg cqg t = 

gly He ala glu val t.hr ala thr ala ala ala ,1a 9 „ g: y „>., val 1,-u a t ala val 
gly ser gin arq OPA ore arg leu arg pro r.r : ala ,,; tyr cys cly an 

asp arg arg gly asp arg asp cvs ,iy arg arg >•; T: arg gly He ala'olv olv'ars 

'i i. i / 1 1 1 '5 S ' / ' ^ ' " 

gac g:*:c aac gee c:. c ggg gec gcg ttq tng cqc :: ; - v* ■: • - 

asp ala asn ala leu gly ala ala l*ra d rg - 1 y v i _ ;. • ; 

thr pro "hr pro ser gly pro an? cys qly ala 1 1 i .-.. r 

ar ? ari 7 pro arq qly arq val val ala a:;; r 

4ei/l^l 5 11/1-; ' 



a, a je: 
s * * r n^r arg ar 
arg arg val r - 



r::r :i^r ala a:-; ' 
/l'^Ol 



WO 99/09186 



PCT/KR98/01813 



135/185 



721/241 751/251 

gca cct gcc egg gcg gtc tac gaa ccc teg ccg cgc gcg ctg ccg ace gac acg get acc 
ala pro ala arg ala val tyr glu pro ser pro arg ala leu pro thr asp thr ala thr 
his leu pro gly arg ser thr asn pro arg arg ala arg cys arg pro thr arg leu pro 

.owL?^ Pr ° 9ly lGU thr l6U ala ala arg val ala a3 P "9 his gly tyr pro 

781/261 811/271 

caa cgc ccc gcc ccg caa ttc gag gtg atg tat ctg ttg gcg gta tgt gat get gca gcg 
gin arg pro ala pro gin phe glu val met tyr leu leu ala val cys asp ala ala ala 
asn ala pro pro arg asn ser arg OPA cys He cys trp arg tyr val met leu gin ara 

o,woo? r ° PI ° 116 gly aSp Val 3er Val 9ly gly met OPA cys cys ser gly 

841/281 871/291 

gcg gac cag ttg egg gat cga etc aag gaa ttg ggt gag teg gtg gcc ate gcc get get 
ala asp gin leu arg asp arg leu ly 3 glu leu gly g iu ser val ala lie ala ala ala 
arg thr ser cys gly ile asp ser arg asn trp val ser arg trp pro ser pro leu leu 

on?/™?" Ue gly ° PA Wl gLy ^ly his arg arg cys ser 

9CW301 931/311 

ccg eee qae age t,r tec cac gtc ,,c ace gac gac gcc ggt gee gee gtg gaa gee 

pro pro asp ser tyr ser val his val his thr a,p asp ala gly ala ala val glu ala 
arg pro thr ala thr pro tyr thr ser thr pro thr thr pro val pro pro trp lys pro 

Q '!" 9 gln l6U lGU arg thr ar - P ro h15 ^ arg arg arg cy, arg arg gly ser arg 
9ol/321 991/331 

gga ttg gcg gtg ggg cqa gtt age egg ate gtg ate Leg gcg etc ggt tec ggg acc age 
gly leu ala val gly arg val ser arg ile val He ser ala leu gly 5er gly thr ser 
asp trp arg trp gly glu leu ala gly ser OPA ser arg ara ser val pro gly pro' aU 
lie gly gly gly ala ser AMB pro asp arg asp leu gly ala arg phe' arg as P gln arg 
1021/341 1051/351 

gga ttg ccg gee ggt ggc tgg acg egg ggc cgc gcc gtg ctg gcg gtc gtc gac ggc gae 
gly leu pro ala gly gly trp thr arg gly arg ala val leu ala val val asp gly asp 
asp cys arg pro val ala gly arg gly ala ala pro cys trp arg ser ser thr a^a th- 

,roi%^ 3 glY tI_P ^ P aU gly Pr ° 3rg arg ald gly arc * arc ? ^g arg arg 

1 C 91/361 1111/371 

ggt gee gcc gag ctg ttc gee ggg gag gge gee tgc gtg etg cga eeg ggt ecu gac gee 
giy ala ala glu ieu phe ala gly glu gly ala cys val leu arg p:o gly pro a3p ala 
val pro pro ser cys aer pro gly arg ala pro ala cys cvs asp arg val gln -h- p-o 
cys arg arg ala val arg arg gly gly arg leu arg ala ala lh: gly serVg^aro a — 
1I4I/3Q L 1 1 7 1 / 3 3 1 j -j - -3 

gtg aca ccg gcc gee gat ate agt gee cac cag ctg gtg e:;g ;;e:; rr a rac a-- 

v.- thr p:o ala ala asp ;le <v-r ala his gin ieu val arg ala val val asp thr gly 



OPA his ar:j pro pro ile 3or val pro 
d s p thr g 1 y a r g a r g t y r c 1 n 
1201/401 



ser trp cys gl 

:i 1 - i c 



pro pro ala giy 
1231/411 

g cac gtg atg gtc; etg ccc aat ggc tat qtq n 



u*.ri thr pro ala 
arg h : s a ; g a : 



a 1 a ala h i s va 1 r.- 1 v 1 1 lev 



i l -\ : . o a. v 



r r 



-y- u • y I-;- i: -i : -u c! v 
.: : 4 :. 



i 1 / 4 b 



1 ; : ■ . p i : 



WO 99/09186 



PCT/FR98/01813 



136/185 



1441/4B1 1471/491 

gcg ctg acc tgg gee ggt acc tgc aag ccg ggc gac ggt ctg gyt ate gcg ggc gac gag 
ala leu thr trp ala gly thr cya lys pro gly asp gl y ieu gly He ala gly a 3 p qlu 
arg OPA pro gly pro val pro ala ser arg ala thr val trp val ser arg ala thr arq 

mnw*m P U ^ 9111 9ly ^ ar9 58r gly tyr ar ? 91 y ^g arg gly 

1501/501 1531/511 

gtg ctg ate gtc gcc gac gat gtc gcc gcg gcg gcc ate ggt ctg gtc gac ctg ttg ttg 

" P a3p Vdl dla ala aU ald lle 9ly leu ™l asp leu l eu leu 
cys OPA 3 er ser pro thr met ser pro arg arg pro ser val trp ser thr cys cy 3 trp 
ala asp arg arg arg arg cys arg arg gly gly his arg ser gly arg pro val val gly 
1j61/521 1591/531 

gca teg gga ggc gat ctg gtg acq gtg cca att ggc gcc ggc gta acc 0 aa gac gtg get 
ala ser gly gly asp leu val thr val leu He gly ala gly val thr qlu a 3 p val ala 
his arg glu ala lie trp OPA arg cys OCH leu ala pro ala OCH pro lys thr trp leu 

i^w C ?l y ^ g 9ly 33p gly aia 33n trp arg arq arq a3n arg arg gly cys 

lo21/541 1651/55 1 

gtc gtc ctg gaa egg cat gtg cac car cic cat cca dC c gag ctg gtc tec tac cgc 

vai val leu glu arg his val his asp his his pro gly thr glu leu val ser tyr arq 
ser ser trp asn gly met cys thr thr thr He gin ala pro ser trp ser pro thr ala 
arg pro gly thr ala cys ala arg pro pro ser arg hi, arg ala gly leu leu pro ru s 
163. /561 1711/571 
acc gga cac cgc ggc gac gcg ctg ctg ate ggg gtc gag tag 
thr gly his arg gly asp ala leu leu ile qly val glu AM B 
pro aap thr ala ala thr arg cys OPA ser gly ser ser 
arg thr pro arg arg arg ala ala asp arg gly arg val 



SEQ ID N° 41T (suite 2) 
FIGURE 4 IT (suite 2) 



1/1 

GCC GGT AAC GCC GCG TCC GAG TGC TAT CCG TC 
ala qly a sr. ala ala ser gin cv:, tv; s 



1 / ■ 1 



11/2 1 



— '-j 'or 1 . 4 CA GCG GC'. 

91/31 

GGC GCC CCG G ' :J CGC G:; ~ CGG CCT CGA CCC GCT CCA CCT GGC: CAT CAC CCA cr A G^v; 
giy aid pro val gly arc gly arg al 



121/4 1 
TAT CGA 
tyr arg 

1 3 1 / o 1 



-i arg r r a a , a : : : ■ : , r - > ■ ; ■ 1 - - - • 1 ^ ^ • 



WO 99/09186 



PCT/FR98/018I3 



137/185 



1 

!/l 31/11 

CCG GTA ACG CCG CGT CCC AGT GCT ATC CGT CCG CCG GAC CGC CCG AAA CAT CAG CGG CGG 
pro val thr pro arg pro ser ala ile arg pro pro asp arg pro lys his gin arg arg 
61/21 91/31 y 

GCG CCC CGG TCG GCC GCG GCC GGG CTC GAC CCG CTC CAC CTG GCC ATC AGC GAC CAG GTT 
ala pro arg ser ala ala ala gly leu asp pro leu his leu ala ile ser asn gin val 
121/41 151/51 

ATC GAG GTG GAA GCG GAC GGT GTT GGG ATG CAC GCC CAA CTT GCC GGC GA- CC GG~ G'T 
ile glu val glu ala asp gly val gly met his ala qin leu ala aly asp arg gly a C p 
lal/ol 211/7' * ? j • r 

GCT CAT CGG AAC CCG CGA CGC ACA CAA TGC CCG CAG CAC CGC ACG ACG GCG CCC CAC CGG 
ala his arg asn pro arg arg thr gin cys pro gl: : his arg tht thr ala pro his arg 
c h 1 / o 1 2 7 1/9' 

CTC TTG CAG TGA CCT GAT GAT GAC ACT CAC c .v -■ — — - „^ „ 

leu ic« urn pro asp asn asp tnr his p:- h - - 1 , , K „ , . 1( , 

301/ 101 331/1:1 ' 1 q 9 

AAT GCA GTA ACT TTA CAC AAA CGG ACT TGT A/— r — - ~~ 

, , - i -■ - - -\.7'o .oil t,.,. Ci.-A io'j CCA 

a^n a. a vai ,e: leu hi.s i yr, arg thr cys lv:; .: .:. a ^ . rn < , . _ r 

3*51/121 " 3^1/131 " ' ^ ^' 

ACA AAC GTG GCA ATG CCG GGC AGC CTC TGC CCT TGT CCC ATC 

thr asn val ala rr.et pro gly ser leu cys p: - ; .- V s ; v : 1 - 



SEQ ID N° 42B 
FIGURE 4 2R 




WO 99/09186 



PCT/FR98/01813 



138/185 



Sequence codante Rv2622 predite par Cole er. al 1993 (Nature 393 • 537-544 ) e r 
contenant seq42A: 

31/11 

atg gcc aac aaa cgt ggc aar. gcc ggg cag cct ctg ccc ttg teg gat cga gac gac gac 
Met ala asn lys arg gly asn ala gly gin pro leu pro leu ser asp arg asp asp asp 
61/21 91/31 

cac atg cag ggg cac tgg ctg ctg gcc egg ctg ggc aag egg gtg ctq cgt ccc gcc age 
nis met yln gly his tr P leu leu ala arg l eu gly lys arg val leu arg pro gly gly 
121/41 151/51 

gtc qaa etc acc egg aca ctg ctg gcc cgc gcc gig gcg acc gac gcc gac gtg etc gag 
val glu leu thr arg thr leu leu ala arg ala glu val thr asp ala asp val leu glu 

iai/oi 211/71 

ctg gea ecu g:;c ctg ggc eg = acc gca gcc gal ate ttg gcc cgc aae cca coo tr„ r„ 
eu ala pro civ le„ gi y d r , hr ala .1. y.u uc leu ala arg asn pro arg sez ty? 

'399 g-9 g^g aqc gat cc: aac gcg gcc aa, 
val gly ala glu ser asp pr) asn ala ala a:;n v \ •■ a - T ^i- v , ^ ^ 

301/ 101 3 3 1 /Ul giy ar<3 

^ C * dC ^ ^ ar r C ^ C 9" ^ acc'gga tta tec gac gcc age gcc gar gtr 

gly asp val arg V al thr a^u ala ala asn thr q 1 - l^, ^ _ , J " 

361/121 ' ^1/^ 



q qr;- cga cac gtt etc gcc gqc cgc 



>p aia ser ala asp val 



gtc ate ggc gag gcg atg ctg ac: atg caa „ c aac gcg get aaa cac acg ate gr c qc- 

val^le gl y glu ala net leu the ,et flin ,ly ala ala lys hi . thr He val La 

gag gcg gcg egg gtg ctg agg eeg ggt ggc rge tac geg att cac gaa eta geg erg gtg 

g.u ala ala arg val leu arg pro gly gly u:y , yr : le hi., glu leu ala ieu val 

:cg gac gac qtc gca gag cag gtc cgc acc - ctg eg. 7 cag 



c t a qr.r. 



pro a,p as:) val a 1 , gla glr, v,. arg thr ,,:,) 1,, arg air: r leu ala arg ala ] 



^ *.JV-'.- v...J._ ^'^ 

. 0.1 1 yi.. yi;i vj. arq c;;r a m> j ar--: n!n ^ - 1^ 

54 1/131 

aag gtc aat gcg cgt ccg ctg acc gtt: g;^ q,V'gg r ; .7 c tea gcc; gg- ^ 

lys val asn aia arq pre- J^u " r r v.-' 1 ■> • < > , t , . -. , " 1 "' ^ - 1 * 

- ■ ■■ , ; ^ .. . 1 . ^ I ^ ''*'. .' s " v * 

leu val val «;iu h : ■. "i 1 v.' - •- - i i .- • , - ' • " ", '' "'- ' '•' -' 

isi/221 " ' ' ' ' ' ■ :,: pro dr;: ' r:: : 



WO 99/09186 



PCT/FR98/018I3 



139/185 



ORF d'apres Cole et al . , 1998 (Nature 393:537-5*14) et contenanc Rv2622 

31/11 

taa aaa cct gcg gag gtg ggg tct atg gcc aac aaa cgt ggc aat gcc ggg cag cct ctg 
OCH lys pro ala glu val gly ser met ala asn lys arg gly asn ala gly gin pro leu 
61/21 91/31 

ccc ttg teg gat cga gac gac gac cac atg cag ggg cac tgg ctg ctg gcc egg ctg ggc 
pro leu ser asp arg asp asp asp his met gin gly his trp leu leu ala arg leu nly 
121/41 151/51 

aag egg gtg ctg cgt cec ggc ggc gtc gaa etc acc egg aca ctg ctg gcc r qc q C r gag 
lys arg val leu arg pro gly gly val glu leu thr arg thr leu leu ala arg ala qlu 
181/61 211/71 

gtg acc gac gcc gac gtg etc gag ctg gca ccg ggc ctg ggc cgc acc gea gee gaa ate 
val thr asp ala asp val leu glu leu ala pro gly leu gly arg thr ala ala aln 
241/91 271/91 

ttg gcc cgc aac ccg egg teg tac gtg ggg gey gag age gat: ccc aac gcg gcc aac c-q 
leu ala arg asn pro arg ser tyr val gly aia glu ser asp pio as:, ala ala asn leu 
301/1C1 331/111 

gtc cga cac gtt etc gcc ggc cgc ggc gac gtc rrgg gtc acc gac gcg gcc gat acc yga 
val arg his val leu aia yly arg gly asp val arg val thr asp ala aia aso thr qiy 

361/121 -iGWiTi * y 1 



361/121 391/131 

tta tec gac gee age gcc qat qtc gtc ate gge gig gcg atg ctg arc atg caa qgc aac 

ieu ser asp aia ser aia asp val val lie gly glu ala net leu thr n-t gin gly asn 

421/141 451/151 

gcg get aaa cac acg ate gtc gcc gag gcg gcg egg gtg ctg agg ccg qgt ggc cgc tac 

aia ala lvs his thr We- \r*\ ala nl n ^ 1 a i -> ^ ^~ „,i i 



^ , . - J -> j ^ ^-v^ yyc; cgc UC 

a. a ala lys nis thr lie val ala glu ala ala arg val leu arg pro gly glv arc tv 

161 c; i i ' 7 t i 3 - ^ * - 



481/161 511/171 

gcg ate cac gaa eta gcg ctg gtg ccg gac gac gtc gca gag cag gtc cgc acc gac ctg 

did -An his glu leu aia lou val pr3 asp asp val ala ciu aln val arg thr as-j lei; 

54 1/ 10 i S7 : / 1 }l 

cqq caq teg ctg gcc cgc gcg etc aag gtc: aar gcg C gt ccg ctg acc gtt gcg gaa tqg 

arg g.n ser ^eu a. a arg ala leu ly- val asn ala arg d:^ val "i 1 a a*-- - 

501/201 631/21: ' 

rcg cac etc tta gcg ggc cat gga etc etc gtc cac gtt r " ♦ — -,- c . 

^ >V-7 ^<~> 7ly leu val v, hi , val v,l tc: aU ser ^ Til 

ttg tta caa ccg cga egg gtg ate get gac gaa eg;- r> c ctg get ccc ctg c-q tt- a -~ 

lr:u leu gin pro arg arg val lie ala i:c; glu gi-- ]..-. ' : ; ■ ■ \\] ^ ~. 



WO 99/09186 



PCT/FR98/01813 



140/185 



1/1 

ate gcg 
ile ala 
61/21 
gtt gtt 
val val 
121/41 
aag att 
lys ile 
181/61 
gtt ctg 
val leu 
741/81 



eg t 
arg 

tea 
ser 

aag 
lys 

cac 
his 



gac 
asp 

gcg 
ala 

gt c 
val 

cgc 
a rg 



ate 
ile 

ggc 
gly 

gcg 
ala 

cat 
his 



leu thr gly 



yeg 



ga t 
asp 

gac 
asp 

ggc 
gly 

ccg 
pro 

ala 



gac 
asp 

gtg 
val 

atg 

met 

cac 
his 

ttc 
phe 



cag 
gin 

gtg 
val 

age 
?er 

tgg 
trp 

ggg 

gly 



ggt 
gly 

cat 
his 

tat 
tyr 

aa t 
asn 

tec 
s e r 



egg 
arg 

ttg 
leu 

ccg 
pro 

cgc 
a rg 

gga 

gly 



31/11 
ctg tgt 
leu cys 
91/31 
cgt taa 
arg OCH 
151/51 
gag aat 
gli: asn 
211/71 
tta ate 
leu ile 
271/91 
ttc gtc 
phe val 



ctg gac 
leu asp 

etc gcg 
leu ala 

gtc ctg 
va J. leu 

tgg ccc 
trp pro 

a a c teg 
asn ser 



gtc ggc 
val gly 

egg age 
arg ser 

gec get 
£ 1 a ala 

gtc gtg 
va 1 val 

aca cct 
thr d r o 



ggt cga acg gta 
gly arg thr val 

tgg cgt ccc caa 
trp arg pro gin 

ggc gag cag gtc 
gly glu gin val 

gtg ctg gtc ttg 
val leu val leu 

tgg cag cag ate 
trp gin gin ile 



SEQ ID N° 43A 
FIGURE 4 3A 



1/1 31/n 



tCg CgC gtg a< T d aCC a ^ 3 tc 99 = nt: tgg ocg teg gcg gtc gaa rg, XP n 

scr a:a val thr ser r.et th* aru V' e 1 " r-~ >^ " , , 7 J 

- c ^;^j p s *-' r ala val g lu a£ g ^ 



; - gga get ggc gtc 



ttg ttt cag egg gcg acg tgg tqc att tgc gtt aac tc 

leu phe glr. arg ala thr trr cvs il- v ,,i ^ .. 

' ' ' ili'l'l " ' 1 q,y Vd: Fr: 

J;!a t = : ' ^ 5" <J~ ^- -0-7 a,, .u ; ctq q , q a q , 

arg .cu arg ser arg a. a OPA ala lie ai.g arg rrv- - so: tr:: ero ieu -a n 

18 1/61 ; i i - • ' ^ " " 



Sr.Q ID N 4 3U 



WO 99/09186 



PCT/FR98/01813 



141/185 



1/1 

cgc gcg tga cat 
arg ala OPA his 
61/21 

tgt ttc age ggg 
cys phe ser gly 
121/41 

gat taa ggt cgc 
asp OCH gly arg 
181/61 

tct gca ccg cca 
ser ala pro pro 
241/81 

gac egg gtt ggc 
asp arg v a 1 gly 



cga tga cca ggg 
arg OPA pro gly 

cga cgt ggt gca 
arg arg gly ala 

ggg cat gag eta 
gly his glu leu 

tec gca ctg (jaa 
ser ala leu glu 

ggc gtt egg qtc 
gly val arg val 



31/11 
teg get gtg tct 
ser ala val ser 

91/31 
ttt gcg tta act 
phe ala leu thr 

151/51 
tec gga gaa tgt 
ser gly glu cys 

211/71 
teg ctt aat ctg 
ser leu a s n leu 

271/91 
egg att cgt caa 
arg lie arq g 1 :\ 



SEQ ID N° 43C 
FIGURE 4 



gga cgt egg egg 
gly arg arg arg 

cgc gcg gag ctg 
arg ala glu leu 

cet ggc cgc tgg 
pro gly arg trp 

gec cgt cgt ggc 
ala arg arg gly 

:;tc gac aec ttg 
leu a r> n thr 1 pi i 



teg aac ggt agt 
ser asn gly ser 

gcg tec cca aaa 
ala ser pro lys 

cga gca ggt cgt 
arg ala gly arg 

get ggt cct get 
ala gly leu ala 

gca gca gat c 



Sequent co :i ,nr.P Rv3278c predite par Cole c: 19^ 39 3 ■ 537 - 5-1 4 ) 

contenant seq43A: 



1/1 



atg age tat zcq gag aat qtc ctg gc: get a ; : aa.; ;* - ,r: ^ a car c -.. r . 



Met ser tyr pro glu asn val leu ala ala q ' ■ 
61/21 



cac tgq aat cgc tta ate tgg ccc gtc g 

his trp asn arg leu il 

ttc jgg tee gg i ttc gt:: aa: teg a:.i ece 

gcg gtc at.: tgg gc-: at., tgg ttg gtg a' 

ala val il-a trn qlv i . tro leu val i. 1 - 



/al leu his arg his pre 



> ■ ' - - ' - - • - ; » - - qqu ttg gcg g .. ; 

rp pro va.. val v,l 1 - : v, 1 1 " '« : a eu thr gly lea ala ala 



WO 99/09186 



PCT7FR98/01813 



142/185 



ORF d'apres Cole et al . , 1998 (Nature 393:537-544) et contenant Rv3278c 
1/1 31/11 

och I? C " C9C CCC a " adg gtC atg age cat ccg gag 

OCH leu ala arg ser trp arg pro gin lys lie lys val ala gly met ser tyr pro III 

aat gtc ctg gec get ggc gag cay gr.c gtt ctg cac cgc cat ccg cac tgg aat cqr tfa 
asn vai leu a.a ala gly glu g l n val Vd , leu hls arg hls prQ his ^ ^ £ - 

i ' ;i/41 151/51 

ate tgg ccc gtc gtg gtg ctg gtc ttq etc, acc 3gg tt g gcy gcg crc ggg tcc ttc 
ile^trp pro v*l val val leu val leu leu thr gly leu ala ala phe g lv ser gU, r he 

gtc aac teg aca cct tqq caq cag ate get aac gtg at.t cac gcg gtc at- tea acq 

^t/ex n set chr pro trp gln gln ile vai his LI ile K 

n: s 12 s :;: m s= ^ r ttc r agc cyg cLy ^ aca 

301/101 ' - ' " 33i,r:^ Pr ° PnC leu 3er tr P Ieu thr thr 

cat ttc gtg gtg acc aac egg egg gtg atg ttc' ggt gtg ctg ace cgc a.c ggg 

361/?21 3511 "« Val >- ^ 1- thr arg ser giy 

£ ;;i k s a " :i: ?i?'if? t Kg gac cgg r ttc ™ 

t ' t C?C a = r g ? g aC ? tLg ^ a ^ ^ • ^ tcci caa y„t r.c? ct: cjaq ttc tac 
lie phe arq tnr q v thr leu i 1 ^ r'- - ' -> . „i , , 

491/iei v " 5 ■ asp pco leu 91 u tyr 

' : a ': : " 7 C ' jC Ct;g ^ 3*-? -7 t.,- c, : gag gtt ttc qac a-- ct- 
asr. He pre arg leu arq qlu val his ala : •■ . ■, . . „.„ , ^. . " 



seq ir. 



WO 99/09186 



PCT/FR98 01813 



143/185 

i'l 31/11 

gcc aag atg gat gtc tac caa cgc acc gcc gcc ggc tgg cag ccg etc aag acc ggt ate 
ala lys met asp val tyr gin arg thr ala ala gly trp gin pro leu lys thr gly ii e 
bl/21 91 / 31 

acc acc cat ate ggt teg gcg gge atg geg ceg gaa gee aag age gga tat ccg gee act 
thr thr his ile gly ser ala gly met ala pro glu ala lys ser gly tyr pro ala thr 
121/41 151/51 

ccg atg ggg gtt tac age ctg gac tec get ttt ggc acc gcg ccg aat ccc ggt gqc gaa 
pro met gly val tyr ser leu asp ser ala phe gly thr ala pro asn pro gly g lv gly 
181/61 211/71 J 

ttg ccg tat acc caa gtc: gga ccc aat car tgg tgg agt ggc gac gac aat age ccr a — 
leu pro tyr thr gin val gly pro asn hi, trp trp ser gly asp as, asn ser pro thr 
<M1/81 271/91 
ttt aac 
phe asn 
301/101 



ttt aac tec atg cag gtc tgt eag aag tec cag tgc cg^fc age acg gee gae age gaq 

phe asn ser met gin val cys gin lys ser gln cys pro phe ser thr ala asn ser gin 



-) j 1 / ill 



aac ctg caa ate ccg cag tac aag cat teg gtc gtg atg ggc gtc aac aag gcc aag qt , 

asn leu. gin lie pro gin tyr lys his ser val val .et gly val asn lys ala lys val" 

oul/121 391/131 ' 1 

cca ggc aaa ggc tec gcg ttc ttc ttt cac acc acc gac ggc ggg ccc acc gcg ggt tgt 

-121/141 Phe ?he ?he hlS thr thr Sly pro thr ala gly C y, 
gtg qcq ate 
val ala lie 



SEQ ID N 3 44A 
FIGURE 44A 



1/: ^ 3i/:: 

:ca aga tgg atg tct acc aac gca ccg ccg ccg get a;;. 



,i aga — g gt_a tea 



r-c ar j trp rr^ t ser thr a s r. ala nro n - c i i - 1 ■ • - , ■ ■ <- „ ■ -, ^ -, „ ' i 

01/21 ' * ^/v * ° * ar<J pI ° Vcil ^ 

cca ccc at a 

d r o c r o i 1 e 



gtt egg egg yea l .: ; cgc r.: n aag cca uga ccg gat ate egg cca 

.r val arg arg ala tro arc arc l'c — ■ • > ■. i , - , _ T „ 

: 2 1 / .n ' " : r : . , : — - ^, ~ . 

' 1 ' : : Oa'- t.f: aca a;: tgg a " : - ; v - ; v -c : ; ;i ; . : .. _ . , 



1 7 ; 



a ; a a a c " ' - 
' : ■ . .. " 5 '. > r 



WO 99/09186 



PCT/FR98/0I8I3 



144/185 



1/1 31/11 

caa gat gga tgt eta cca acg cac cgc cgc egg ctg gca gec get caa gac egg tat cac 

gin a S p gly cys leu pro thr his arg arg arg leu ala ala ala gin asp arg tyr his 

91/31 

cac cca tat egg ttc ggc ggg cat ggc gec gga age caa gag egg ata tec ggc cac tee 

his pro tyr arg P he gly gly his gly ala gly ser gin glu arg ile ser gly his ser 
121/41 151/51 

gat ggg ggt tta cag ect gga etc ege ttt tgg cac cgc gee gaa tee egg tgg egg gt t 

asp gly gly leu gin pro gly leu arg phe trp his arg ala glu ser arg trp arg va7 
18I/6I 211/71 

gee gta tae cca agt egg aee caa tea etg gtg gag tgg cga eg, caa tag ece cac ctt 

ara val t.yr pro ser arg thr gin ser leu val glu trp arg arg gin AM 3 pro his leu 
^' u/yi 271/91 

taa etc cat gca gqt eta tea rr^-. r^-,- f „. irt 

=c ?/{ . ; ^ ,™ .„ ~ r-r - - - - «; - # 

cct gca cr.c gca gta caa gca ttc ggt cqt gat ggg cgt caa caa ggr- , aa q~ , C c' 

Telnet Pr ° V ' ! ^ P ^ ^ ^,11? ^ 9iy 9ln % pro 

agg caa agg etc cgc gtt ctt ctt tea cac cac' ^ egg egg gec cac ece ggg ttq t<r 

arg^glr. arg reu arg val leu leu ser his -3 arg arg arg ala hi., arg gly leu cys 

ggc gat c 

gly asp " " * . m • • 



SEQ ID N° 44C 
FIGURE 4 4C 



WO 99/09186 



PCT/FR98/01813 



145/135 



Sequence codante RvO309 predite pa: Cole et al., 1998 (Nature 393:537 -544) e - 
contenar.t Seq4 4A: 

1/1 31/11 

atg age cga etc eta get tig ctg tgc get geg gta tgc aeq ggc tge gtt get gtg gtt 

Met ser arg leu leu ala leu leu cys aid ala val cys the gly cys val ala val val 
61/21 91/3i 

etc gcg rca gtg age ctg gee gte gtc aac ceg rga tic gcg aae t.cg gtc ggc aat gee 

leu ala val ser leu ala val val asn pro trp P he ala asn ser val gly asn ala 

121/41 15l/i>l 

act cag gtg gtt teg gtg gtg gga acc ggc gyt : q a::; gee aa? atg gat gte tae eaa 

thr gin va i val ser val val gly thr gly gly ser. thr ala l V s met asp val tyr qln 
181/61 211/71 ^ 

cgc acc gec gee ggc t.gq cag ceg rr,- aag 

arg thr ala ala gly trp gin e:_o lea 1 ya 
241/t31 " ' 271/91 

ggc atg. gcg ccg gaa gec aag age gga tat < 



9 a"- ■ i - ace cat ate ggt tc:g gag 
9 : y -nr thr his lie gly ser ala 



i r -q ggg gtt tac age ctg 



a - / 



ala pro glu ala lys ser gly tyr pre ala ihr p:a met :l v val tvr*s 



1 tyr^er le.u 



3 01/101 

gac tee get ttt ggc acc geg ccg aat cce ggt gg., agg tta tat acc eaa gtc gga 

asp ser ala phe gly thr ala pro asn • J 



i a t a. c a c c . 



361/121 

ccc aar cac tgg tgg agt ggc gac gac 

pre asn his trp trp ser gly asp aso asn ser nra tr- 
421/141 " 451/ is: 

eag aag tec cag tgc ccg ttc age aag gec gac age ga \ aa, 

gin lys ser gin cys pro phe ser thr ala -aa ^> r - a'" a — 
4 3 1/161 ' 5 1 'l / 1 7 1 ' 

aaj- cat teg gre g^g atg gee gtc aac aa; :; a a i j aa - . 

lys his ser val val met gly v.ii ace lya all : v ; vm • ■ 
541/ 13 1 : 



pro tyr: tar gin val gly 

c: - : " ' :: " a: - 1 cag g^c tgt 

asn ser met q\t\ val cys 

ctg eaa ate ccg cag tac 

^ea gin lie pro gin tyr 

eg:: aaa gga tec geg it - 

'4 ' V -ys gly se r ala oh" 



WO 99/09186 



PCT/FR98/01813 



146/185 



ORF d'apres Cole et ai., 1993 (Nature 393 : 537- S.; ; > et conter.ar.C Rv030? 
1/1 31/11 

tga gcg atg age cga etc eta get ctg ctg tge get geg gta tgc acg ggc tgc gtt get 
OPAala met ser arg leu leu ala leu leu cys ala ala val cys thr gly cys val ala 
61/^1 91/31 

gcg gtt etc geg cea gtg age ctg gee gte gtc aac cog u,g ttr geg aac teg gtc ggc 
val yal leu ala pro val ser leu ala val val as:, pro trp phe ala asn ser val giy 

1 2 I / 4 J 1 5 1 / S I 

aat gec act cag gtg gtt teg gtg gtg gga ggc ggt teg acg gec aag atg gat qt~ 

asn ala thr gin val val ser val val gly thr gly gly ,er thr ala lys met aso val 

1 3 1 / o 1 211/71- ^ 

tac Cdd eye ace gec gec ggc tgg caq ccg etc aag g :;t: aCc acc -..^ ^ . fj _ 

tyr gin arg thr ala ala gly Lrp gin pro leu lys thr gly lie thr thr his lie qlv 

2 41/81 2 7 1 / 9 1 



teg gcg 
.ser ala 
331 '101 


ggc 
gly 


atg 
net 


geg 
ala 


ccg 
pro 


g a a 
glu 


ala 


aag 
lyii 


c g _ 
e e r 


gga 

q 1 V 

3 3 1 


t a 


Cl - : 'J 
p: a 


g : . ■ . 
ala 


a e t 
Lhr 


eeg 
P ro 


atg 
met 


ggg 

gly 


gt t 
va 1 


t a c 

t y :; 


age ctg 
ser leu 
351/121 


asp 


5 c: 


get 
ala 


L 1 1 . 
p h e 


■J ' ? 
g.l y 




ala 


CC.J 

p r o 


a a t 
a s n 

3 31. 


pro 
'13 1 


] g 
QLy 


gg 7 
gly 


g g g 

gly 


t f 
leu 


c c: g 
pro 


tat 
tyr 


a e e 

t u ^ 


ca a 
gin 


grc gga 
val gly 
421/141 


pro 


a a t 
a s n 


e a c 
his 


t g g 
trp 


trp 


agt 
ser 


ggc 

gly 


ga c 
asp 


gae 
asp 


aa: 
a 3 n 
'15*1 


S e T 


pro 


thr 


t t *~ 

phe 


a a c 

4l* 11 


tec 
s er 


atg 
me t 


cag 
gin. 


gtc tgt 
val cys 
4 31/161 


cag 
gin 


aag 
lys 


tee 
s c r 


cag 


tge 
eye 


p ro 


t tc 
p h e 


a g e 
5. c r: 


a e g 
re: 


ala 


.) s p. 


ag 7. 
s e r. 


gag 
g 1 u 


aac 


ctg 
leu 


caa 
gin 


ate 

lie 


ccg 
pro 


cag La;: 
gin tyr 
5*11/161 


a a g 


c a t 


tcg 
li e r 


val 


9 " : * 

va 1 


a t g 
rr,e t 




Va . 


a i 




a ; a 


a a .7 


v a 1 


eea 
p ro 


ggc 
gly 


a a a 
lys 


ggc 

r. 1 ■ f 


tec 
a f r 


geg ttc 
aia phe 

uO l/2 0 1 


p h *j 




ca ^ 




ac e 


















3 - 3 




a t e 


a s 


ga t 
asp 



i^a thr ho 

ool/' 22 I 



a 1- 
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Fragment clone en fusion avec phoA 

1/1 31/11 

gat etc ccc gga cac cag gtc ate egg cga gat ggt gat cga ggc teg gac ccg cag gca 
asp leu pro gly his gin val ile arg arg asp gly asp arg gly ser asp pro gin ala 
61/21 91/31 

tec ggt age cag agg eac cag cat cag eaa cat cge gat ggc cag cat gec gcg ccg tea 
ser gly ser gin arg his gin his gin gin his aig asp gly gin his ala ^ £ ^ 
121/41 151/51 

ggt cct tgc cac teg cga tec ttg gga tga egg tgg gqc ata get age gcg car r aq q - r 
gly pro cys his ser arg ser l eJ g;y OPA arg trp gly . le ala ser ala his gin val" 
181/61 ?11/71 

ate gtg cca gae egg gca tgc cge gtc ggc aag ctg -..eg ggc gcg ggt tag age ggt age 

PC ° " g VJ1 9li ' lyS l6U * er 9lv «la gly AM3 ser olv J- 

241/81 271/91 

gtg cga ccc agg atg gcg aat get. egg ggg tea ccg gcg aag tgg tag ccg egg atg at, ' 

val arg pro arg met ala asn ala arg y l y ser pro ala lys trp AMB pro arg met me 

301/10. 331/111 

teg gtg aag ccc aac egg egg tac aae cge cac gec eg. t.tg tec tea ccg ttg gt~ , C c 

ser Vd. _ys nro asn arg arc tvr asn a-o h'-; > ■ -, - ■ T 

361/121 ' ' a ill/ir p " ieu val ser 

ggt gtg go, age agg acg ttg tec teg cga ccg get age agt egg egg gec aac gee 

gly vax g.u ser arg thr icu ser ser ser arg pro ala .or ser arg arg ala asn ala 

451/151 

tec ccg agg cca egg cct tga gcg egg gca agg atg tgc aat tea gtc: aac teg aag tag 

ser pro arg pro arg pro OPA ala arg gly arg net cys asn ser val asn ser 1 ys AKB" 

•i □ JL / x b 1 

ctg gtc ate agt egg qcg ate get agg eg, gga aag erg ctg cgt tgc aag ccc aqt acc 

^" ™ 116 ar<3 iie ala a " *~Y iVS leu arg cy, pro 8 * r thr 

j 'i l / ^ t? ^ 71/191 

acc tgc tgt tgc c,,; cue :.gg erg ggc g.e g;> , a g ccg tac gec a r.. cc, cge at: 

-^ / ';^ CV ' 5 CyS hls ni: ' tr P ^ 1:J '3 ] y a]a f )r ^^y Ay3 P co ^ ala Vh: pro ser Hi, 

^ ^ " ^ 5=3 5 : = g ^ :: - ^ w .g- t„ t,_- 



all ,il ^ reir . ;c: thr a;.: d : .i t r: r \ \ 
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961/321 

tea get cgt cgc tgc ggc 
ser ala arg arg cys gly 
1021/341 

gat tga cct cgt ate ate 
asp OPA pro arg ile ile 
10B1/361 

att acg tga cag tct gtc 
ile thr OPA gin ser val 
1141/381 

atg ctt gac cag ate gag 
met leu asp gin ile glu 
1201/401 

cgt ggc ggg ggc ttc cgc 
aig gly gly gly phe arg 
1 2 61/42 1 

ate ate ggt ctg ggg atg 
lie lie gly leu gly met 
1321/441 

ttc ccg ata ct e age gtt 
phe pro ile leu ser val 
1331/461 

aac ggt cct eg g ttg tee 
thr gly pro arg leu ser 
1441/481 

cag cgt cgt acc aag ggg 
gin arg a : y t. h : 1 y s y 1 y 



991/331 

gec gee ggg ata gaa Ccg ccc 
ala ala gly ile glu ser pro 

1051/351 
tga gtt agt tgc ccg cgc aat 
OPA val ser cys pro arg asn 

1111/371 
ggc aag gag gga cgc atg cca 
gly lys glu gly arg met pro 

1171/391 
age get etc tac gec gaa gat 
ser ala leu tyr ala glu asp 

1231/41 1 
qca ccg acc qcq cqg egg rnr 
ala pro thr ala arg arg arg 

1291/431 
ttg gtt tec ggc gty gc:g etc 
leu val ser gly val ala ohe 

1351/452* 
ttc ggt ttt gtc gtg atq ttc 
phe gly phe val val rr.et phe 

14 11/4 7 1' 
ggc agg aty gat cgt ggc gga 
gly arg rr.et asp arg gly gly 

1471/491* 
gec ggg ggc tea ttc acc age 
ala g 1 y g 1 y s e r phe thr ser 



gcg aac cag tgg tac ggc gca 
ala asn gin trp tyr gly ala 

ggg cat ccg cgt gtt ate ggt 
gly his pro arg val ile gly 

etc tec gat cat gag cag egg 
leu ser asp his glu gin arg 

ccc aag ttc gca teg agt gtc 
pre iys phe ala ser ser val 

ctg cag ggc gcg yi.y lig ttc 
leu gin gly ala ala leu phe 

aaa gag acc atg ate gga agt 
Iys glu thr met ile gly ser 

ggt ggt gtg gtg tat gee ate 
gly gly val val tyr ala ile 

teg get get ggg get teg cgc 
ser a 1 a ala gly ala ser arg 

cgt atg gaa gat c 
arg net glu asp 



SEQ ID N° 45ZA (suite) 
FIGURE 4 5ZA (suite) 
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fragment seq45ZA en decalage moms 1 pour la pha:;e he lecture 
1/1 31/11 

ate tec ccg gac acc agg tea tec ggc gag atg gtg ate gag get egg ace cgc agg cat 
lie ser pro asp thr arg ser ser gly glu met val ile glu ala arg thr arq arq his 
61/21 91/31 

ccg gta gec aga ygc acc: age ate age aac ate gcg atg gee age atg ccg cgc cgt egg 
pro val ala arg gly thr ser lie ser dsn ile ala met ala ser met pro arq arq arq 
121/41 151/51 

gec ctt gee act eg rr gat cct tgg gat gac ggt gqg gca tag eta gcg cgc acc agg tea 
val leu ala thr a r } asp pro trp asp asp cly civ ala AMI* leu ila arg thr arq -er 
131/61 711/71 

t-g tgc caq acc gg 5 cat gee gcg teg gca age rgt egg gcg c:gg g r t. aga gcg gta gcg 
ser cys gin thr gly his- ala ah^er ala ser c.ys arg ala arg val arg ala val ala 
2-1/81 271/01 

r.gc gac cea gga r gg C ga ?.tg etc ggg y^L cac egg cga agt gqt age cgc gga tga tgt 
cys asp pro gly trp arg :net lea gly gly n:s arg ar: gly ser arg gly OPA cvs 

301/101 331 /-;i: 

cqg tga age eca aee ggc rjgt aca acc gee acc r gat tgt. cct cac eg- tgg t^t cc? 

arg OPA ser pro tar gly ;;ly thr thr ala thr p : , asp cyrs pro his arg tro ^: P ro 

3t-l/121 3^1/131 ' 

gtg tgg aga gca gga cgt. tgt ecr rgt cgc ? ac :;gg ::ta g 7a gte ggc gag c:a acg cct 

val trp arg ala ;ly arg :yr» pro arg arg .::g, arg a 1 -j val 



Ly gly pro thr p 



r o 



421/14 1 ; . 

cec cga ggc cac ggc ctt gag cgc ggg gaa w tgt g:r» att cag tea act cga agt age 
pro arg gly his gly leu glu arg gly glu gly cys ala :i, gin ser thr arg ser se - 
481/161 li;/ 171 

tgg tea tea gte ggg cga teg eta ggc ge: 
trp ser ser val gly arg ser leu ql v ala 
54 1/181 



' - gca age cea gta cea 
a 1 ala ser pro val pro 



cct get gtt gee 
p re a 1 a va 1 a ] i 

c-: :/20i 



-J-'- ~ ■> 'j - J 1 - - : : - 1 ' : ; cea ere cga gca ttr 



g~v arg a. a 



arg leu or 

~v :/;n 1 



pro leu arg ala 



- - : q 7 1 - g e t 

a la g 1 v cvs a \ 1 
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1021/341 

att gac etc gta tea tct gag tta gtt gec 
ile asp leu val ser ser glu leu val ala 
1081/361 

tta cgt gac agt ctg teg gca agg agg gac 
leu arg asp ser leu ser ala arg arg asp 
1141/381 

tgc ttg acc aga teg aga gcg etc tct acg 
cys leu thr aiy ser arg aid leu svr thr 
1201/401 

gtg gcg ggg get tec gcg cac cga ccg cgc 
val ala gly ala ser ala his arg pro arg 
" 1 ~ ) 5 1 /421 

tea teg gtc tyy gya tgt tgg ttt ccg gcg 
ser ser val trp gly cys trp phe pro ala 
-1321/441 

tcr cga tac tea gcg ttt teg gtt ttg teg 
ser arg tyr ser ala phe ser val leu ser 
1391/461 

ccg gtc etc ggt tgt ccg yea gya Lyy ate 
pro val leu gly cys pro ala gly trp ile 
14-11/461 

age gec gta cca agg ggg ccg ggg get cat 
ser val val pro arg gly pro gly ala his 



1051/351 

cgc gca atg ggc ate cgc gtg tta teg gta 
arg ala met gly ale arg val leu ser val 
1111/371 

gca tgc cac tct ccg ate atg age age gga 

ala cys his ser pro ile met ser ser gl*' 
1171/391 

ccg aag ate cca agt teg cat cga gtg tee 

pro lys ile pro ser ser his arg val ser 
1231/4 1 1 

ggc ;gc gee tgc agg gcg egg cgt tgt tea 

gly gly ala cys arg ala arg arg cys - 

12 91 -'4 3 1 "■ .* 
tgg cgt tea aag aga cca tga* teg gaa gtt 
trp arg rer lys arg pro OPA ser glu val 

13 51/451 

tea tgt teg gtg gtg tgg tgt. atg era tea 

OPA cys .ser val val trp cys met pro sei 
1411, 471 

- ;: 1 " r:: J c ^ C * : '-J c tg ggg ctt cgc gec 

val ala a:ep dig leu .1 eu gly leu arg ala 

14 7 1/491 

tea cca gec gta tqq aag ate 

ser tro ala val trp lys il~ 



SEQ ID N° 45ZB (suite) 
FIGURE (st::o) 
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fragment seq45ZA en decalage moms 2 pcur la phase de lecture 
1/1 31/11 

tct ccc egg aca cca ggt cat ccg gcg aga tgg tga teg agg etc gga ccc gca ggc ate 
ser pro arg thr pro gly his pro ala arg trp OPA ser arg leu gly pro ala gly ile 
61/21 91/31 

egg tag cca gag yea cca gca tea gca aca teg cga tgg cca gca tgc cgc gec gtc ggg 
arg AMB pro glu ala pro ala ser ala thr ser arq tro r>ro ala cys ara a) a val gly 
121/41 151/51 ' 

tec ttg cca etc gcg ate ctt ggg atg acg gtg ggg cat age tag cgc gca cca ggt cat 
ser le'j pro leu ala ile leu gly met thr val gly his ser AMB arg ala pro gly his 
181/61 211/71 

cgt gee ag=i ccg ggc atg ccg cgt egg caa get gtc ggg cgc ggg tta gag egg tag cgt 
arg ala arg pro gly net pro arq arg gin ala val gly arg gly leu qlu an AMR 
241/61 2/1/91 

gcg ace ca 7 gat gg - gaa tgc teg ggg gtc acc ggc gaa gtg gta gec gcg gat gat gtc 
ala thr gin asp gly glu cys ser gly val thr qly glu val val ala ala aso asD val 
301/101 331/11! 

qqt gaa qc: caa ccj gcg gta caa ccg cca cgc ccg att gtc: etc a~r g:t ggt etc: cga 
gly glu ala gin pro ala val gin pro pro arq pro lie val leu thr val glv leu a -a 
361/121 391/131 

tgt gga gag cag ga : gt.t gtc etc gtc gcg acc ggc tag =ag teg gcg ggc caa cgc etc 
cys gly glu gin asp val val leu val ala thi glv AMB gin ser ala qly q\n a-c leu 
•121/M1 451/i51 ^ J 

ccc gag gc: acq gc : ttg age gcg ggg aag gat gtg caa ttc agt caa etc gaa gta get 
pro glu ala thr ala leu ser ala gly Ivs aso val cln phe scr gin leu g^u val ala 
431/161 511/171 

ggt cat cag teg ggc gat jgc tag gcg :.:gg aaa gec get gcg ttg caa gec ~ag tac cac 
gly his gin ser gly asp arg AM 3 ala arg lys ala ala ala leu gin ala gin tyr his 
j-11/181 . 571/191 

eta ctg ttg cca cca ctg gec ggg cgc :cc ggg ata gec gta cgc cac tec gag cat tgg 
leu leu leu pro pro leu ala gly arg ore gly ile ala val a r -: his h , - 

oGl/201 631/211 ' ' * 



arg va^ al l qln phe gi ■/ qly arq arg gin 

;ge \gc ear tac c: ? qa ggc cgc gac cqc 
glv cys arg ty :. 1-a a.sp glv arc asn a r-j 



7 5 



WO 99/09186 



PCT/FR98 01813 



152/185 



961/321 
















991/331 
















age teg teg 
ser ser ser 
1021/341 


ctg 
leu 


egg 
arg 


cgc 
arg 


cgc 
arg 


egg 
a rg 


gat 
asp 


aga 
arg 


ate gee cgc 
i 1 e ala arg 
1051/351 


gaa 
glu 


cca 


gtg 
va 1 


gta 

Vdl 


egg 
arg 


cgc 
a rg 


aga 
a rg 


ttg acc teg 
leu thr ser 
1081/361 


tat 
tyr 


cat 
his 


ctg 
1 eu 


agt 

ser 


tag 
AM 8 


ttg 
leu 


ccc 
pro 


gcg caa tgg 

a .L a y .L 1 1 Lip 

1111/371 


qca 

did 


tec 
ser 


gcg 
aia 


tgt 

cys 


tat 
tyr 


egg 
a rg 


tat 
tyr 


tac gtg aca 
tyr val thr 
1141/381 


gtc 
val 


tgt 
cys 


egg 
a rg 


caa 
gin 


gga 
el v 


ggg 

ai v 


aeg 
th r 


cat gec act 

U 1 U Lilt 

1171/39] 


etc 


cga 
arg 


tea 
ser 


tga 
OPA 


gca 
ala 


gcg 
ala 


ga t 
asp 


get tga cca 
ala OPA pro 
1201/401 


gat 
asp 


cga 
a rg 


gay 
glu 


cgc 
arg 


t c: t 
ser 


eta 
leu 


cgc 
arg 


cga aga tec 
arg a r g s t j r 
1231/411 


caa 
q n 


gtt 


cgc 
a rg 


ate 


gag 
gi u 


tgt 
cys 


ccg 
pro 


tgg egg ggg 
trp ar.g qlv 
1261/421 


ctt 
leu 


ccg 
pro 


cgc 
arg 


acc 


gac 


cgc 


qcg 


gcg gcg cet 
jj.d aid pro 
1291/431 


gca 
ala 


ggg 

gly 


cgc 
arg 


giy" 


val 


qt t 
val 


e a t; 
his # 


cat egg tct 
his arj ser 
1321/4 41 


ggg 

gly 


gat 
asp 


gtt 
val 


ggt 
gly 


ttc 
phc 


egg 
a rg 


eg t 
arg 


ggc gtt. caa 
gly val. qlr. 
13 51/451 


a g i 
arg 


ga c 
asp 


cat 

his 


gat 

JSD 


egg 

arg 


aag 
1 ys 


ttt 
phe 


ccr gar. act 
pro asp thr 
1381/461 


cag 
gin 


cqt 
a i y 


tct 
piie 


egg 
a ; g 


tt t 
ph- 


tgt 
c y s 


arg 


gar gtt egg 
asp val arg 
Mil/47: 


■-g g 


tgt 

C V:i 


g g t 
gly 


■?ta 
va 1 


tgc 
cys 


cat 
his 


cac 
his 


egg tc: teg 
arg ser ser 
1441/481 


gtt 
val 


gtc 
va 1 


cqg 
arg 


cag 
g ^ r. 


gat 
asp 


gga 
gly 


3 C 1 


- -j i { - g g a _ e 
1 4 7 1/491 


ggc 
g 1 / 


tgc 
cys 


tgg 

trp 


ggc 


ttc 
phc? 


gcg 
a 1 a 


cca 
pro 


gcg teg tac 
ala ser tyr 


caa 
gin 


ggg 
gly 


ggc 
gly 


egg 
a r g 


ggg 

gly 


etc 

leu 


at t 

i .1 e 


cac cag ccg 
his qlr. pro 


tat 
tyr 


gqa 
gly 


aqa 
arg 











SEQ ID N° 452C (suite 1) 



FIGURE 4 5ZC (suite 1) 
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Sequence Rv216 9c predite car 
3eq45A 
1/1 

atg cca etc tec gat cat gag 
Met pro leu ser asp his glu 
51/21 

gaa gat ccc aag ttc gca teg 
glu asp pro lys phe ala ser 
121/41 

egg cgc ctg cag ggc gcg gcg 
a r g a r g leu gin gly a 1 a a 1 a 
181/61 

gcg ttc aaa gaq acc atg ate 
ala phe lys glu thr met lie 
241/81 

atg ttc ggt gat yty gtg tat 
rr.et phe gly gly val va 1 tyr 
301/101 

ggt: gga teg get get qgq qet 
gly gly ser ala ala gly ala 
3 51/12! 

acc age cgt atg qua qat. egg 
thr ser arg rr.et :;lu asp arg 



Cole et al . , 19 9b (Nature 
31/11 

cag egg atg ctt gac cag ale 

gin arg met leu asp gin lie 
91/31 

agt gtc egt ggc ggg ggc ttc 

ser val arg gly gly qly Pne 
151/51 

ttg ttc ate ate qqt ctg ggg 

leu phe i 1 e i 1 e gly ; e u gly 
211/71 ^ 

gga agt ttc ccg d La c - a.'t: 

qly ser phe pro lie leu ^ e r 

gee ate ate ggt ett ttg 
ala lie thr qly pr: arg leu 
3 J 1 / 1 1 1 

teg cge cag c;t cgt ace aag 
ser arg gin arg ar 7 it: 

3 1 : / : ; 

tte egg cgc c:jc tt ;: g a - ; 
phe arg are arg r\V: > r el a 



393:537-544) et contenant 



gag age get etc tac gec 
glu ser ala leu tyr ala 

cgc gca ccg acc gcg egg 
arg ala pro thr ala arg 

atg ttg gtt tee ggc gtg 
met leu val ser gly val 

gtt ttc ggt ttt gtc gtg 
val phe gly ehe val v,V 

tee ggc agg atg gat cgt 
i;er gly arg x.et asp arg 

egg gtc ggg ggc tea ttc 
^ ; L y a 1 a g 1 y gly ser p h e 

t a a 



SEQ ID N° 45D 



FIGURE 4 50 



WO 99/09186 



PCT/FR98/018J3 



154/185 



1/1 








Cag CCCf 


cgc 




3 t c 


gin pro 


ara 


a rg 


ile 


61/21 








tec ggt 


gaa 


cat 


cgc 


ser gly 


glu 


his 


arg 


121/41 








ccg gcc 


aac 


tea 


cag 


pro ala 


asn 


se r 


gin 


181/61 






cgt cgc 


ate 


gcc 


gtc 


arg arg 


lie 


ala 


val 


241/81 








Leg ggc 


Leg 


aag 


cca 


ser gly 


ser 


lys 


pro 


301/101 








a c c acq 


cag 


acc 


aag 


t h r. ala 


gin 


thr 


lys 



gac cag ggc etc acg 
asp gin gly leu thr 

acc agg tta ggc age 
thr arg leu gly ser 

aca ccc tct acg atg 
thr pro ser thr met 

etc gcc gcc gtt age 
leu ala ala val ser 

age ggc gga cca ctt 
ser gly gly pro leu 

get etc aag ago q ;• ; 
ala leu .1 v.<i se r ala 



31/1 1 

ccc ggt cac tte tec 
pro gly his phe ser 
91/31 

aat ccc gcg gac ccg 
asn pro ala asp pro 
151/51 

c a C J ggt atg egg acc 
gin :jly rr.et arg thr 
211/71 

ate gee ger- act gtc 
lie ala ala Lhr val 

211/ } 1 

ccg gac gcq aag ccg 
pro a so ala lys pro 
331/111 

■ : - ■■• : «-:rg ' : acg 



gcg tte etc aac aat 
ala phe leu asn asn 

cac ccc act cgc cga 
his pro thr arg arq 

ccc aga cgc c^e tgc 
pro arg arg his cy.s 

gtt gcc ggc tgc tcq 
val ala qly cys <^ r 

ctg gtc gag gag gee 
leu val glu glu ala 

gtc a a c g q c aag a t e 
val asn gly iy ; . i 1 



SEQ ID N° 4 6A 
FIGURE 4 6A 



WO 99/U9186 



PCT/FR98 01813 



155/185 



1/1 

gcc gcg ccg cat cga 
ala ala pro his arg 
61/21 

egg tga aca teg cac 
arg OPA thr ser his 
121/41 

qgc caa etc aca gac 
gly gin leu thr asp 
181/61 

rcg cat cgc cgt cct 
s e r hi 5 ci r g a *_ y ui j 
241/81 

ggg etc gaa gcc aao 
gly leu glu ala lys 
301/101 

cgc gca gac caa ggc 
arg ala asp c; i r. g 1 v 



cca ggg cct cac gcc 
pro gly pio his ala 

cag gtt agg cag caa 
gin val arg gin gin 

acc etc tac gat gca 
thr leu tyr asp ala 

cgc cgc cgt tag cat 
a : g a r g a r y AM B h i s 

cqq egg acc act tec 
arg arg thr thr scr 

t.cf r.ia gag cgc gca 
ser gin giu arc ala 



31/11 

egg tea ctt etc cgc 
arg ser leu leu arg 
91/31 

tec cgc gga ccc qca 
ser arg gly pro ala 
151/51 

ggg t:,u gcg gac ccc 
gly tyr ala asu nm 
211/71 

cgc cgc cac tgt: cgt 
arg arg his cys arq 

2 1 1 / 9 1 



gga cgj gaa c;.-c qcx 
qly arg glu ala ala 
331/111 




gtt cct caa caa etc 
val pro gin gin phe 

ccc cac teg rcg ace 
pro his ser pro thr 

cag acg cca ctg ccg 
gin thr pro leu pro 

tgc cqq ctg c:t.c gr,~ 
cys arg leu leu val 

ggt cga gga ggc cac " 
gly arg g \ y gly his 

caa egg caa gat: c 
qln arg gin asp 



SEQ ID N° 46C 
FIGURE 4 6C 



WO 99/09186 



PCT/FR98 01813 



156/185 



Sequence codante Rvl4Uc predite par Cole et ai., 1998 (Nature 393* 537-544) « r 
contenant seq46A: 

1/1 31/11 

atg egg acc ccc aga cgc cac tgc cgt cgc ate gec gtc etc gec gec gtt age ate gee 
Met arg thr pro arg arg his cys arg arg ile aid va 1 leu ala ala v a i s~r Ue a'a 
61/21 91/31 

gec act etc gtr gee ggc tgc teg teg ggc teg aag CC4 agc , g .. „ c .^ cr 

ala thr val val ala gly cys ser ser gly ser lys pro ser gly g^y pco i" u ^ *^ 
121/41 151/51 ' 

gcg aag ccg ctg gte gag gag gee aee gcg cag acc aag get etc aag age geg ca:- a'q 
ala lys pro leu val glu glu ala thr ala gin thr lys ala leu 1 vs *i, kO -.1^ 

133/61 211/71 



gtg ctg aeg gtc aac ggc aag d ,.c: eeg gga ctg tet etg aag aeg ctg agc gge gat etc 

^/81 U . P " ^ ^ eU ^ thr leu ser gl y a'sp leu 

acc ace aac ccc acc gec gcg aeg gga aac etc aag etc aeg etc, eg- gen ~ a - ->-* 

thr thr a sr. pro thr ala ala thr gl v asn v,i i-s i. u ? * 

301/101 J " £i,ln 9 y * ly r,Pr a5p 110 

gat gee gae tte gtg gtg tte gac ggg ate etg tac gee acc etc aeg c— aa - ^ ► 

asp ala asp phe val val phe asp gly ile xeu tyr ala r r. r leu thr p^ asn gin trp 

J 6 x / 1 ^ 1 3 9 1 ' 1 3 1 

age gat tte ggt ece .gee gee gae ate tac gac ccc gec cag gtg etg aat ccg gat acc 

J;;,"? ?he 5ly E ' r ° a,a ala as ? ile c V r «P P« *la gin val leu asr. pro asp thr 

ggc etg gec aac gtg etg geg aat tte gec gae ge, aan gec gaa ggg egg gat acc: ate 

fal/Jei V " lcu Jla ^ phe ala ^.g; ,ys g " : gly drg as " ^ iic 

,jd ' J 9^- caf -i ^ 1 : a — arc ~ ' • a-.- acc ggg aag t:q c. 

asr. gly gla asr. thr :ie a-j ii- ser cOy lys val s 



g c g g t g aaj c a g a r a 
1 1 a g 1. r. aid val a sr. q 1 r. 1 1 < ■ 



d 'i 1/181 ; 

gcg ccg ccg tte aac gcg ac:; cag ccc ctg c c g. :j . t : : - - - - : CJJ 

a. a pro pro p;;~ ti s;i ala tnr qlr. cro vai c i o - : a »- --^ r... , - fT ; , 

-f' 0 1/201 ' ^ i ■ ? — " ^ 1 " J ' ' ' " " L " jT * 



4 6i 



WO 99/09186 



PCT/FR98/01813 



157/185 

OP.r d'apres par Cole et al . , 1 998 {Nature 3 9 3: 37-544) : 
et cant.enar.t. J a sequence codante Rvl411c: 

1/1 31/11 

tag etc acc cag gtt gqa ccg gtt cag tgt etc ggc cat cac gtc ggc ggt gaa ttg gec 
AMB leu thr gin val gly pro val gin cys leu gly his his val gly gly glu leu ala 
61/21 91/31 

gtc ggg caa tac ate gac gac cgt cag aca cac gec gtt gac age gat cga gtc gee gtg 

val gly gin tyr lie asp asp arg gin thr his ala val asp ser asp arg val ala val 
1^1/41 151/51 

gee ggc gtc ggc ggt aac cat cgq acc gca gat qqt cag ccg cgc cgc ate gar rag go- 

ala gly val gly gly asn his arg thr ala asp gly gin pro acq arg lie asp gin gly 
181/61 211/71 

etc acq ccc ggt cac tte tec gcg ttc etc aac aat rrc ggt gaa cat cgc acc agg tta 

leu thr pro gly his phe scr ala P he leu asn .u: gly glu his arg thr arg leu 

2 4 1/81 o 7 1 1 n 1 

ggc age aaL ccc: gcg ga: ccg cac ccc act cgc cga ccg gec aac tea cag aca ccc tcr 

gly ser asn pro ala asp pro his pro thr arg arg pro ala asn ser. gl n thr pro ser 
301/1 01 331/111 

acq atg cag ggt atq egg ac: ccc aga eg: ca , : ;/ - v - r ,\~ a r ~ gr . c gt . z ctc q .-_. 

^hr gin gly rr.et arg thr pro arg arg hi. ,y, arg arg rle ^~ leu ala all* 

3 b 1 / 1 / 1 3 j 1 / 1 3 ' 
gtt age ate gec gec act gtc gtt gec ggc tgc ; • ; t--;g qq ~ 



' : tcq aaf 7 cc?. age ggc gga 

^ " ia a±a vai ™- — — ^ ^r g i y giy 

■i 2 I / 1 -1 x 4 J 1 / 1 r r ' 

cca ctt ccg gac gcg aag ccg ctg gtc gag gag gec acc gcg cag acc aag get ctc aaq 

pro leu pro asp ala lys pro leu val glu glu ala thr ala gin thr lys ala leu lys 

481/161 51 1/ 1 7 1 - 

age gcg cac atg gtg ctg acg gtc aac gg~ a,; ccg gca ctg tct ctg aaq acq .- tg 

ser ala his met val leu thr val asn cly lys ;1- :-■•> -i- w... 5 „ r , , 

541/181 ' b - : ' ' ' ~ * ^ ° 

age ggc gat ctc acc acc aac ccc acc .;; c c g : ; > ; :: , 

ser gly asp leu cr.r t; n r asn pro thr ala a.i ;.c: .: ; v a c:: 



giy ser 3so asp ala acc one val 



601/201 

ggg' tct gat ate cat gec 
al 

661/221 
ccc aac 
pro as n 

i a t erg 
a en ore 



j g i • 



lys leu thr leu gly 



•• < - i ; ' c . ; ; . • ' : t a c g c act 



■' 2 t> j 

aa _ 



WO 99/09186 



PCT/FR98 01813 



158/185 



1/1 

gag ctg gtc aac ggc gcc ggc ate gac gac 

glu leu val asn gly ala gly lie asp asp 
61/21 

ctg gcc gat gcc cag cag atg gtc gag gcg 

leu ala asp ala gin gin met val glu ala 
121/41 

gtg ttg gtg gcc teg ggc age aac car gtg 

val leu val ala ser gly ser asn his val 
181/61 

ttc gac get gtg at 3 gac gcg aac gtg egg 

phe asp ala val met asp ala asn val arg 
2 41/ o I 

egg gtg ctg etc gag cag ggt cag ggc ggc 

arg val leu leu glu gin gly gin gly glv 
301/101 

ggq ttg ggc aat gee gcc ggt tac age gcg 

gly leu g 1 y a r> n ala ala gly 1 7 r s e r ala 



31/11 

gcc gcc gtc gtg acc tgc egg ccg gac age 
ala ala val val thr cys arg pro asp ser 
91/31 

gca ccg ggc cga tat ggc cgt ttg gac gga 

ala leu gly arg tyr gly arg leu asp gly 

151/51 

gcg cc: att acc gag atg gcc gtc gag gac 

ala pro ile thr glu net ala val glu asp 
211/71 

ggt (jr.--: rgg ctg gtg tgt egg gcg gcc gga 

gly ala tip leu val cvs ara ala al* flu 

2 71/91 

age gtg gtg ctg gtg teg tec gtt cgc ggc 

ser v a 1 v a 1 leu va 1 ser ser va 1 arg gly 

3 31/111 

ta: j T: " r ] aag gcg ggc acc gat c 

tyr cy.; pr;j ser lys aid gly thr asp 



SEQ ID N° 4 7A 
FIGURE 4 7A 



WO 99/09186 



PCT/FR98/0I813 



159/185 



i' 1 31/11 

get ggt caa egg cgc egg cat ega cga cgc cge egt cgt gac eLg ccg gec gga cag cct 

ala gly gin arg arg arg his arg arg arg arg arg arg asp leu pro ala gly gin pro 
61/21 91/31 F 

ggc eqa tge eca gca gat ggt cga gyc ggc act ggg ccg ata tgg ccg ttt gga egg aqt 

gly^arg cys pro ala asp gly arg gly g ly thr^gly pro lie trp pro phe gly arg ser 

gtt ggt ggc etc ggg cag caa cea tgt gge gee' cat Uc cga gat ggc cgt cga gga 

Tsui"/ 9 y 9 " gl " prn cys gly *un s tyc arq a3p gly arg arg " Y leu 

cga cgc tgt gat gga cgc qaa cgt gcg ggg tqc ctu act cat nm , r.„ __- - 

arg arg cy s asp gly arg glu arg ala gly cys leu ala gfy val so~r g?v gry" arg th" 
„41/81 271/31 > 

ggt get get ega gca ggg tea ggg egg cag egt ggt get ggt gtc gte egt teg egg egg 

any r' - - ' ■ 

3 3:/: 

gtt ggg caa tgc cge egg tta cag eg; gta 



v y v , , jJ 9 g 5qt gct gg; s tc qtc cg t tcg c„ g c yy 

qly ala aJa arg ala gly ser gly arg glu arg gly ala gly val val arq S or arq arg 

J ! J x / i u i 1 3 1 / " 1 I 

*' a - y)y C ^ ar 9 9ln arg val leu pro val glu gly gly his arg 



SEQ ID N° 47C 

FIGURE 4 7C 



WO 99/09186 



PCT/FR98/01813 



160/185 



Sequence codante Rvl714 predite par Cole et. al., 1998 (Nature 393: 537-544) et 
contenant seq 4 7A: -jj/ dhh) et 

1/1 31/11 

gtg gag gaa atg gcg ctg get cag cag gtg ccg «c ctg ggc ctg gcg cgc ttc age ato 
va ,1„ glu met ala leu ala gin gin val pro asn leu gly leu III a'g £° val 

61/21 91/31 

cag gac aag teg ate ctg ate ace gge gcg ace ggt teg ttg ggc cga gtt gec gec caa 
g n asp l ys ser ,le leu Ue th, gly ala t,r gly ser leu" % v arg S HI HI 1% 

11 151/51 
gcg ctg gee gac gcg gga gcg egg ctg aea ctg gec ggc gge aac teg gee ggt eta ace 
ala leu ala asp ala gly ala arg leu thr leu ala gly qlv asn J r a !?„ !?? 
131/51 211/71 



IT III m it it; III % £ % IT, IT IT IT S T. TT IT TT "° - 

241/81 27V9' SCr 

leu "la as' S " " 9 ^ ^ C C * a tJC ^ ^ ttg gac gga 

301/fo! 1 5 ^ U ala «* ^ ^ "g leu Lp ?? y 

gtg ttg gtq gee teg ggc age aac cat ylu ere r~'~ -> •- •- 

val leu val ala ser oiv J. ... ' V? ~r gag "9 9« <Jtc gag gac 



.., /; . ; v.u ... .„ , iy .„ ..„ M . v>1 • - - - - ;« - 

£,$ - - « - - •» a ss 3; si ss a s - - s: k it 

1 451/151 

egg gtg ctg etc gag cag ggt cag ggc gge age gtg gtg etg gr q teg t^e gtt ca^ aac 

Wlntl leu leu glu gin gly gin qly qly val ieu val J SP \ ^ ^ ™ 

999 ttg ggc aat gec gec ggt. t:ac a-- geg ta"- tq- r- c - -c- in ^ 

ni v i,,,, ,i„ ,, n , ; " J ^ - ,c, aa.j qcq acc gar eta 

gw i^j g.l y aon a. a a. a gly tyr sui did t.yr r- V c ; s ,-_ , . j 

541/131 r-n/,:', " giy thr aco iou 

ttg gec aag aca ttg c;cg ccc era- tg- -ac get - -i ~ - 

leu ala lys thr leu ala ala g^u tro qly Q l- a^- i' ; • J T'l "' ' 3 ^ ^ 5 ^ 

601 /201 y ' di fi::ri leu ' ala 

^ ^ ^ o ^ 1 /' ? 1 1 

ccg acg gtg tr.t egg tc. g::-; -;r , v .- f ; 



p.-o thr va! pne arg . , r: 

n r WW - * 



* ? 1 / 2 1 
i V . j ' . .: * 



WO 99/09186 



PCT/FR98/01813 



161/185 



OP.F d'apre S Cole et al 1 998 (Mature 393: 537-5-M) et contenant la sequence 
codante Rvl714: 

2 */ 1 b<l/H 

tag gtg gag gaa atg gey ctg get cag cag gtg ccg aac ctg ggt ctg gcg cgc ttc age 

AMB val glu glu met ala leu ala gin gin val pro asn leu gly leu ala arg phe sir 
84/21 114/31 

qtg cag gac aag teg ate ct.g ate acc ggc gcg acc ygr teg tta ggc cga gtt rcc qcr 

yal gin asp lys ser He leu He thr gly ala thr giy .or leu qly arg val ala ala 
144/41 17 4' a ; 

C '" gCq CCq qCC gaC 5=9 gga 9=g egg ctg aca ; - g gec ggc ggc aac teg gec ggt ctg 

arg ala leu ala asp ala gly ala arg leu thr leu ala gly -,iy asn ser ala al v l 
2 04/61 2 3 4.7 1 " J 

gee gag ctg gtc aac ggc gec ggc ate gac gac' g^c ge : gtc gtg acc tgc egg ccg gac' 

ala glu leu va. as,, gay ala gly He asp asp ala ala val val thr cys arg pro asp 
2 o 4 / 8 1 ■ 2 °* 4 . 9 1 

ajc ctg gec gat gec cag cag atg gtc gag geg - - ; !; ,- ,. Ja tat gqc Q ■ 

ser leu ala asp ala gin gin val glu ala a. a .-a giy ; : , Lyr ~ !y a rg le ' \ 



3."!4/l 01 



Jb-1 / 111 



g 7 a gtg ttg gtg gec teg ggc age aac rat gtg gc:; c,:: act. acc gag atg gec gtc gag 

3,y yal reu va l a. a ser gly serr asn his val al, pc ~ , hr <glu met ala val * lu 3 

gac ttc gac get gtg atg gac gcg aac gtg egg gg- -c:: tgg _cg y L y tgt. egg gcg gc- 

asp pne asp ala val r.et asp ala asn val arg gly ala tip icu val cvs ar-g ala ala 



gga egg gtg ctg etc gag cag ggt cay gg.~ 

gly arg val leu leu glu gin gly gin gly 
504/151 

gic ggg ttg gg- aat gec c;cc get tae a . 
^4/131 

atg ttg gec aag aca ctg gcg c:cc gaa ; .; : 

ieu Jei: a. a 1 yc tnr leu ala ala glu t:c 
o 14/2 01- 



■\z gtg gtg ctg gtg teg tec gtt cgc 



/al 



or ser val org 



s -a \j -j ■ 
ala gl<, 



'gg gtg aac gcg 
r:; val. asn ala 



WO 99/U9186 



PCT/FR9801813 



162/185 



1/1 

ayg etc atg age 
arg leu met ser 
61/21 

gac acc etc cgt 
asp thr leu arg 



aag acg gtt etc 
lys thr val leu 

caa ctg eta cca 
gin leu leu pro 



31/11 
ate ctt ggc gcg 
lie leu gly ala 

91/31 
cct gag gat. c 
pro glu asp 



SEQ ID N° 46 
FIGURE 4 8A 



ggt gtc ggc ggc 
gly val gly gly 



ctg acc acc gec 
leu thr thr ala 



1/1 

ggc tea tqa gca aga egg ttc tea 

gly ser O ? A ala arg a r q v h e ser 
61/21 

aca ccc tec gtc aac tgc tac cae 

thr pro ser val asn cys tyr his 



^. y 
leu 



ctg agg 
leu arg 



3 1 / : ■ 
gcg ; 
ala a :: q 
91/31 
at: 
ile 



gec tga c;a 
a i a OPA pro 



SEQ ID N' 3 48B 



FIGURE 4 8B 



WO 99/09186 



PCT/FR98/018I3 



163/185 

5e^48A CC C ° dame RV ° 331 pr ^ dlte P ar Cole ct ^99 (Nature H<H : 5 37- 5 44) et covenant 

1/1 31/U 

atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg acc acc gec gac acc 
Met ser lys thr val leu He leu gly ala gly val gly gly l eu thr thr ala asp chr 
61/21 91/31 

etc cgt caa ctg eta cca cet gag gat cga ate ata ttg gtg gac agg age ttt gac ggg 
leu arg gin leu leu pro pro glu a 3 p arg Ue lie leu val asp ara ser phe a 3 p all 
l^l/Al 151/51 J 

acg ctg ggc ttg teg ttg eta tgg gtg ttg egg ggc tgg egg cag cct gac gac c^c rac 
thr leu gly leu ser leu leu trp val leu arg gly trp arg arg pro asp asp vll atg 
181/61 211/71 

gtc cgc ccc acc gcg gcg teg ctg ccc ggt gtg gaa atq gtt act gca acc gtc gec car 
val arg pro thr ala ala ser leu pro gly val glu net val thr ala thr val ala his 
241/B1 271/91 

att gac ^ y^y gec cag gta gtg cac acc gac aac age gtc ate ggc tat gac gcg ttg 

^mmp? Wi V ^ ^ a5P 83n 3Gr Val lle *ly ^ «p ala leu 

J01/1C1 331/111 

gtg ate gca tea ggt gcg gcg ctg aac acc gac gec gtt ccc gga ctg teg gac gcg err 

val lie ala leu gly ala ala leu asn t.hr asp ala val pro gly leu ser asp ala leu 

3ol/121 391/131 

gac gec gac gtc gcg yge cag ttc tac arc ctg gac ggc gcg get gag etc cgt gca aag 

asp ala asp val ala gly gin phe tyr thr leu asp gly ala ala glu >u arg ala lys 

4H/141 451/151 

gtc gag gcg etc gag cat gqc egg ate get gtg get ate gee ggg gtg reg ttc aaa tg, 

val glu a.a lee g.u hi, gly arg He ala val ala He ala gly val pro P he lys cys 

481/161 511/171 

cca gee gca ccg ttc gaa gcg gcg ttt ctg ate gec gec caa etc qgt qac cgc tac go- 

fjf ala phe <? iu ala ala phe lee He ala ala glr. leu gly a3D arg tyr all 

541/18. 571/191 

acc gga acc eta cag ate gac acg ttc acg cct gae erg er g re .j atg ccc gtt gca gqr 

thr gly thr val gin He asp thr phe thr pro asp pro leu pro met pro val ala gly 

t 01/201 6317211 



o r.i.'i pro 

v"' <3^:: 7v = acq 
H y asp gly -hr 



ccc gag gtc ::ac gag get ttg gtc teg atg etc aag gat cac gtc ggc tH car e- 

pro glu val gly glu ala luu val ser met leu lys asp his glv va i qi- 
tol/221 691/231 

ccc aag gee Ha uet ege etc gat gag nee; gca acq ace a* e ca.~ -rr 

arg lys ala He ala arg val asp glu ala ala arg th 
721/241 751/251 

tec gaa ccg ttc g i t ctg ctt qec gtg q' c ccc c 

sei glu pro ;:he as;-, ] re ]te a: a vH ". t - --r^ 
7^1/261 • , A 



■ : > a 

,i a ". r a ' 



:a: gvg 



W O 99/09186 



PCT/FR98/01813 



164/185 



° R ! ^^n,^ 016 ^ 1998 (N " Ure 3?3: = 37 " 544 > « covenant l a sequence 

codante Rv0331* M 



1/1 31/11 

tga aca ccc gcg ccg acq egg cga caa teg egg aaa ace ggt ceg egg gaa tqc tge ggg 

OPA thr pro ala pro thr arg arg gin ser arg lys thr gly pro arg olu ey.s cys ail 

61/21 91/31 - i -i j 



cca tgg gee gat aat agt ttg act gac teg gee aqt cac ccc *ag aec r.tg eg- a.q acr 
pro trp ala asp asn ser leu thr asp ser val ser his pro lyr, thr leu arg lys thr 
L ^l /4i 151/51 

gcg gcg gaa tct aat att cca aag ata tat gga act cga tqc aaa gga at- aqq ct- a-<y 
ala ala glu ser asn He pro lys He tyr gly thr arg. cys qlu gly ile arg leu n-.et 
------ ^11/ ii 

age aag acq gtt etc at, ctt ggc gcg ggt gtc ggc ggc ctg acc ac 3 gec gac acc etc 
cr lys thr val leu He leu gly ala gly val gly gly leu thr chr ala th ^ 

^ <1 1 / b 1 2 71/91 

cgt caa ctg eta cca cct gag gat cga ate ata ttg gt:; gac agg age ttt gac gcg fog 
arg gin ;eu pro pro glu asp arg lie ile leu val aso arq ser „, *<v ^ 

301/101 331/111 " ; 

ctg ggc ttg teg ttg eta tgg gtg ttg egg ggc tgg eg 3 egg cct qac qae gtc cgc gtc 
leu gly ieu ser leu leu trp val leu a:,; gly trp arj arg pro asp as, val arg val 
3ol/121 391/131 

cgc ccc acc gcg gcg teg ctg cc: ggt gtg gaa atg gtt act gca acc; gtc gee cac at- 
thr dId " ld acr ieu 9ly val giu net val thr ala thr val ala his ile 

421/141 .151/151 

gac ate gcg qec cag gta gtg cac acc gac aac age gtc ate ggc tat gac gcg ttg gtg 
asp lie ala ala gin val val his thr asp asn ser val i 1 e gly tyr asp ala leu val 

4HJ/16L .511/171 
ate gca tta ggt gcg gcg err; aac acc gac acc gtt : 
lie ala lee gly ala ala leu dsn thr asn al^ val : 

5 '1 I / I j3 I ' 1 - G - " 



qga c C teg gac gcg etc gac 
g-y io 1 .; ser acc ala leu asn 



gec gac gtc erg ggc cag ttc tac aca ct 

ala asp val ala a;v cm ph-; tvr thr ]' 
tVl 1/201 

gag gcg etc -aac cat cc ' rgg a : c get gt 

clu ala lea - 1 ■ : his c 1 v a;.; a! 1 



ct.^ cct gcg aag gtc 
1 c-a Ire aig ala lys val 

^r'l c <'~ :: tea ttrj aaa tec cca 



WO 99/09186 



PCT/FR98/01813 



165/185 



901/301 

gaa ccg ttc gat ctg ctt gcc 
glu pro phe asp leu leu ala 
961/321 

gcg ggt etc age gaa tec ggg 
ala gly leu ser qlu ser gly 
1021/341 

gac: aac gtg tgg a:c ate ggc 
asp asn val trp ala ile gly 
1081/361 

ccc aag get gcc gtq ttc gcc 
pro lys ala ala val phe ala 

T 1 /I 1 / 1 Q ^ 

cat etc ggt tac gat; ;ta get 

his leu gly tyr asp val ala 
1201/401 

ace ggt gat cac cag qca gee 

thr gly asp his qln ala ala 
1261/421 

gtg acg ctg tac ccg ccg teg 

val thr leu tyr pro cro ser 
1321/441 

tgg ctg ace cge tgg aag acg 

trp leu thr arg trp lys thr 



931/31 1 

gtg gtc ccc ccg cac gtg ccc 
val val pro pro his val pro 
991/331 

tgg ata ccc gtg gac ccg cgc 
trp ile pro val dsn pro arg 

1051/351 
gat gcg acc gtg ctq acg ctg 
asp ala thr val lei: thr leu 

1111/371 
gaa gcc cag gcc g;:a grt gtc 
giu ala gin ala ala val val 

117 1/391 
gag cgc cac ttc acc ggc acg 
glu a: g h \ s p he thr g 1 y t h r 

1231/411 
aag ggc gac g;;c gat : t: ;y - 
lys gly asp gly asp phe phe 

12 91/43: 
egg gag ttt ca: gag gag aac 
arg glu phe h: ^ glu qp,; ]. y- 

tga 



tec gcc gcg gcg egg tea 
ser ala ala ala arg ser 

acc ctg tec act age gcc 
thr leu ser thr ser ala 

ccg aut ggc aaa ccg ctg 
pro asn gly lys pro leu 

gcc cac ggc gtc gcc cgc 
ala his gly v-i i. ala arg 

qgc gcc tgc tac gtc gag 
gly ala cys tyr val glu 

get ccg teg gcg ccc teg 
ala pro ser ala pro ser 

gtc gca caa gaa ctg gcc 
val ala gin glu leu ala 



SEQ ID N° 48F (suite) 
FIGURE 4 8 F (suite) 



WO 99/09186 



PCT/FR98/0I813 



166/1B5 



Fragment amplifie par PGR d'apres les similarities de sequences avcc une serine 
protease de la fanulle htrA de E . coll (creation du site BamHI a 1'extremte ■ 
et du site SnaBI a 1'extremite 3') ct sous-clone dans le vecteur pJVED- 



1/1 

cca tct 
pro ser 
61/21 
tga tec 
OPA ser 
121/41 
tec gtc 
ser val 
1 b l / fo l 
tea tga 
ser OPA 
241/81 
egg tgg 
arg trp 
301/101 
egg ccg 
arg pro 
351/121 
aat tgg 
asn trp 
421/141 
aac ggc 
asn gly 
481/151 
tgc gca 
cys ala 
541/181 



aca ccg 
thr pro 

gtg gcg 
val ala 

tga cca 
OPA pro 

aca age 
thr ser 

ccg ggg 
pro gly 

age ggg 
ser gly 

cca ggc 
pro gly 

agg caa 
arg gin 

cci atg 
pu »T.e t 



etc aac 
leu asn 

agt tgt 
ser cys 

acg gta 
thr val 

tgc gtt. 
cys val 

gga tgg 
gly trp 

tgg cgc 
trp arg 

tga cag 
OPA gin 

t: 

ggc tgg 
gly trp 

teg aac 



age 
scr 

tea 
s e r 

gtt 
val 

ggg 

gly 
tea 



gaa 
glu 

agg 
arg 

tta 

leu 

tct 

s e r 



egg qcc 
arg ala 

tgt cgc 
cys arg 

cgc tgc 
arg cys 

tgc tat 
cys tyr 

cce ggg 
pro gly 

ccg acg 
pro thi 

cat tea 
his ser 

ccg acg 
p r d thr 

tga tgg 
OPA tr:; 



aga 
arg 

ggc 
gly 

tga 
OPA 

tga 
OPA 

ccg 
oro 



a 1 1 
lie 



31/11 

cgc tgc 
arg cys 
91/31 
gca cca 
ala pro 
151/51 
tct c C d 
ser pro 
211/71 
teg tgg 
s p r t r o 
271/91* 
ggc tga 
gly OPA 

3 3 1/111 
tec cgc 
cys 3 ly 
391/13] 
taa tgc 
OCH cys 

4 5 1/15 1 
c .• ;: a r a 



egg teg gtg 
arg ser val 

ccg ccg ace 
pro pro thr 

a a a gtc tea 
Ivs val ser 

gtg gga teg 
val gly ser 

ggc -gg tgg 
gly arg tip 



ore a 



pro ser pro 

tgc ggg cgc 

cys gly arg 

aat ngc :fta 

a en cys val 

cec :gg ggg 

y.ro arg gly 



ctg 
leu 

aac 
asn 

age 
ser 

ggg 

gly 

gee 
a 1 a 

tct 
ser 

tgg 
trp 

d ro 



leu 



ccg 
pro 

ggg 

gly 
cca 

tgg 
trp 

gec 
ala 

teg 
ser 

ccg 
pro 

cgc 
arg 

cgc 
arg 



aga agg 
arg arg 

tgc utg 
cys leu 

ccg aag 

n r r\ lire 
i- — - J " 

egg teg 
arg ser 

tea ccg 
ser pro 

gca gcg 
ala ala 

agt c a c 
ser his 

taa cgt 
OCH arg 

ggc ; a: 
gly t y : 



egg 
arg 

cca 
pro 

cag 



ccg 
pro 

aag 
lys 

acg 
thr 

ggg 

gly 

cgc 
arg 

cca 
pro 
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901/301 931/311 

egg gca ttc ccg tgc agg age gec gtc tgg tgt ttg aac ggt ttt acc ggt egg cat egg 

arg ala phe pro cys arg ser ala val trp cys leu asn gly phe thr gly arg his arq 
961/321 991/331 

cac ggg cgt tgc egg gtt egg gee teg ggt tgg cga teg tea aac agg tgg tgc tea acc 

his gly arg cys arg val arg ala ser gly trp arg ser ser asn arc trp rvs ser thr 
1021/341 1051/351 ' " 

acg gcg gat tgc tgc gca teg aag aca ccg acc cag gcg gec age ccc ctg gaa eg- cga 

thr ala asp cys cys ala ser lys thr pro thr gin ala ala ser pro leu qlu arq are 
1081/361 llll/3n g 9 

ttt acg tgc tgc tec ccg gee gtc qqa tgc cga ttc cgc age ttc ccg gtg cga rgg ctg 

phe thr cys cys ser pro ala val gly cys arg phe arq ser phe pro val are a-q 
wii/J3. 1171/391 

gcg ct: gga gca egg aca teg aga act etc ggg -t egg cga acg tta tct cag tgg aat 

a. a le-j gly ala arg thr ser arg thr leu gly val dLy i:g thr leu ser qln tro asn 
1201/401 1231/411 

etc agt cca cgc gcg caa cct agt tgt gca gtt act qtt gaa age cac acc cat ycc agf 

leu ser pro arg ala gin pro ser cys ala val thr val qlu ser h< s t>— s 
-2ol/421 1 291 '431 

cca cgt atg qcc aag ttg gec cga gta gtg ggc ttu gta cag gaa gag caa cct age ga- 

pro arg met ala lys leu ala arg val val gly leu val gin glu glu gin pro ser as D 
1321/441 1351/451 

aLg acg aat cac cca egg tat teg cca ccg ccg cag cag ccg gga acc cca ggt tat get 

met thr asn his pro arg tyr ser pro pro pro gin gin pro gly thr pro gly ty- ala 
1391/461 . 1411/471 

cag ggg cag cag caa acg tac age cag cag ttc gac tgg cgt tac cca ccg tc~ ccg ccc 

gin gly gin gin gin thr tyr ser gin gin phe asp trp arg tyr pro pro ser ore p^o 
1441/481 .14/1/491 t - 



it gag q: 
■i glu a : 



ccg cag eta act cag tac cgt. caa c.~-; 

pro gin pro thr g .1 n t y r a r g gin p :c 

1 50 1/501 ' * 1L , 3: 

ata cct qqc gtg att ccg acc atg acq ccc cct 

l 1 pre gly val tie pro thr rr.et thr rro r : o 



aca get ate ttg gec ate ggt 
ala civ r-' leu ala i > civ 



g ggt ggt acc egg ccg gqt ctg 
■u gly gly thr arg pro gly leu 

atg gtt tgc caa cgc r.~t rqt 



ggt ggt 



l I c i c 



a t q r r 



I 
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1/1 

cat eta cac cgc 
his leu his arg 
61/21 

gat ccg tgg cga 
asp pro trp arg 
121/41 

ccg tct gac caa 
pro ser asp g I p. 
181/61 

cat gaa caa get 
his g 1 u gin a 1 a 
241/81 

rr.Tf rrr — ~ r> ^ <■ - r , ■■ , 
- — -j -j -j^y 

gly gly arg gly 
301/101 

ggc cga gcg ggt 

gly arg ala gly 
351/121 

att ggc cag get 

lie gly gin ala 
4 21/141 

acg gca ggc aag 

t h r a la gly 1 y s 
481/161 

gcg cac caa tgt 

ala his gin c v s 
54 1/181 

gca gga gat; ggt 

ala gly asp g 1 y 
601/201 

ggt agg caa tit::, 

gly arg arg y/nn 
n 1 / 2 2 1 

' ; { ■■; .it g g .: t a • 

arg his gly Or A 
7 21/2-;; 



tea aca gee ggg 
ser thr ala gly 

gtt gtt cat gtc 
val val his val 

egg tag ttc get 
arg AMB phe ala 

gcg ttg ggt get 
ala leu gly ala 

gat. ggt cac c^.j 
asp gly his pro 

ggc gcg aac cga 
gly ala asn arg 

gac ,-iya ggc att 
asp 'irg gly ilc 

get ggt tac cga 
ala gly tyr arg 

cga act ctt gat 
arg thr leu asp 

cga cct gcg tgc 
arg p r o a 1 a c y s 

ggt gga cct gtc 
g i y ql y pro va 1 

eg*: eg* cga •: 
a r g a : g arg p r o 



31/11 
cca gac get gee 
pro asp ala ala 

91/31 
gcg gcg cac cac 
ala ala his his 

151/51 
get gat etc caa 
ala asp leu gj n 

211/71 
att gat cgt. ggg 
lie asp arg gly 

271/91 
ggc egg get gag 
gl y arg ala gl u 
331/11 1 
cga cct gcg gee 
arg pro ala ala 
391, '131 
caa ttt aat get. 
gin phe asn ala 
4 51,' 15 1 
cgc egg aca tga 
arg arg thr OVA 
511/L71 
ggc etc gat ggc 
gly leu asp gl y 
571/191 
cga tgt get ggc 
arg cys ala gly 
6 31,211 
ccg agg cga eg • 
pre arc; a r 7 a : g 
6 9 1 / 2 3 1 
a g e : ■ g g a g t ) 
f: 1 r: pro gly a : 1 



ggt egg tgc tgc 
gly arg cys cys 

cgc cga cca acg 
arg arg pro thr 

aag tct caa gec 
lys ser gin ala 

tgg gat egg ggt 
trp asp arg gly 

gec ggt ggg ccg 
ala gly gly pro 

eat cce cgt ctt 
his pro arc; leu 

gcg ggc get ggc 
ala gly ala gly 

att gcg tac err 
lie ala tyr pro 

ccc ggg ggc tec 
pro gly gly ser 

tea aat eg a g g a 
ser a:;;; are gly 




cga gaa ggc ggt 
arg glu gly gly 

ggt get tgc cat 
gly ala cys his 

cac cga age agt 
his arg ser ser 

ggc ggt cgc cgc 
gly gly arg arg 

cct cac cga age- 
pro his arg ser 

egg cac; cga cga 
arg gin arg arg. 

cga gtc acg gga 
arg val thr gly 

get aac gtc get 
ala asn val ala 

gcg get ace caa 
ala ala thr gin 

att gtc cac act 
lie val his th: 



gca cga gee qqt 
ala arg ala gly 
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1031/361 1111/371 

tta cgt get get ccc egg ccg teg gat gee gat tec gca ger tec egg tge gac ggc tog 

?""' ala 313 Pr ° Pr ° S " as P ^ «P ala ala se, arg cys asp civ tro 

1141/381 1171/391 

cgc teg gag cac gga cat cga gaa etc ccg ggg ttc ggc gaa cgt t^t etc act cga at- 

t'm/!n, 9 g y 917 Phf "' ylv ar ^ £vc leu s " 51 Y He 

1201/401 1231/41'. 

tea gtc cae gcg cgc aac eta gtt gtg cag tta ct 5 ttg aaa gec aca ccc atg era gtc 

1^/4^1 iC -.: C; - lys ala thc P" ™* pro val 

cac gca tgg cca agt tgg ccc gag tag tgg gec'ta^ac ag :j aag age aac eta gcg aea 

^ :,/i a , ^ tCP Pr ° gl ' J Mm tip dld A ™ r - arg lys ser as, leu ala thr 



tga cga ate acc cac ggt att cgc cac cgc car i, ; - •> - - -t- ,, , , r— 

OPA arg ile thr his giy ile arc h-s A ,~ .C ' - '.' \V' T 9 5 CCC 

1301/461 Y * ^ mi^-V dt « g - u ?ro gln val ir - L 

agg ggc age age aaa cgt aca gec age ayl t.cg ( .,, acc cac cgt ccc cgc e- 

^^^e:"^ ^ ^ ; ^ ^ " £ ??C;C.- ■ - P- arg ? rc 



1 . 



eg:: age can ccc agt acc gtc aac cct acq age; cgt tgg gtg gta ccc ggc egg gtc tga 
!501/501 "?!"?, CCP V ' U VJl Pr ° qlV ar * val OPA 

tac ctg gcg tga ttc cga cca tga cgc cc: c':c c^V, t . g( , : r r gcc aac ct „ t 

SJi/Si 0?A phe arg pro 0?A arg p " J:;. ;; :, - — ieu vai 

* r -~"J ~cg gca teg gcg gcg 



cag gca tgr tgg cca tec; gcg egg tga :q.i ta ; C g-; t j-j t g 

""^ AX: ' ^ sc: all ala 



gin ala cys tip p:u b^r. a I a are CPA 
1621/541 



egg ccq c .i t ccc tgg f ..: ggt tea dec : ; : ; t , : : ■ • . ... 

<i: ] pro h:e -re trp ser: g.y ir. r ■. ■ . ' n " " J " T " ^, ' 

16^1/561 ' * " ' ^"^ " ' " " / 1 ^ L '' d " s 1,13 
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1/1 

ate tac acc get caa 
ile tyr thr ala gin 
61/21 

ate cgt ggc gag ttg 
ile arg gly glu leu 
121/41 

cgt ctg dec aac ggt 
arg leu thr asn gly 
181/61 

atg aac aag ctg cgt 
rr.et a sr. lys leu arg 
241/81 

gtg gc- ggg ggg atg 
val ala gly gly met 
301/101 

gec gag egg gtg gcg 
aid glu arg val ala 
361/121 

ttg gee agq ctg aca 
leu ala arg leu thr 
421/14 1 

egg cag gca agg ctg 
arg gin ala arg leu 
481/161 

cge acc aat gtc qaa 
arg thr asn val glu 
5 4 1/18 1 

cag gag atg gtc gac 
gin glu rr.ct val asp 

6tl/201 

qta qg-: g.i t 1. 1 •■; ete 



cag ccg ggc cag acg 
gin pro gly gin thr 

ttc atg teg egg cge 
phe met ser arg arg 

agt teg ctg ctg ate 
ser ser leu leu ile 

tgg gtg eta ttg ate 
trp val leu leu ile 

gtc acc egg gee: ggg 
val thr arg ala gly 

ega acc gac gac ctg 
arg thr asp asp leu 

gag gca ttc aat tta 
glu ala phe asn leu 

gtt acc gac gec gga 
val thr asp ala gly 

etc ttg atg gec teg 
leu leu me t ala ser 

erg eg: - - gat at ; 
leu arg ala cisp v.-il 



31/11 

ctg ccg gtc ggt get 
leu pro val gly ala 
91/31 

acc acc gec gac caa 
thr thr ala asp gin 
151/51 

tec aaa agt etc aag 
ser lys ser leu lys 
211/71 

gtg ggt: ggg ate ggg 
val ql v al v lie al v 

2 7 1/91 

ctg agq ccg gtg ggc 
leu dig pre val gly 
331/111 

cqq cc; ate cce gtc 
arg pro i \ e pro val 

3 91/131 

atg ctg egg gcg ctg 
me t leu a l g ala ie u 
451/151 

cat gaa tig cgt: acc 
his glu leu arg thr 
511/17 1 

atg gee C ::g ggg get 
1 al a. p: o gl y ala 

- *- '} get r a a ate gag 

c ■: i / ? \ : 



gec gag aag gcg gtg 
ala glu lys ala val 

egg gtg ctt gee ate 
arg val leu ala ile 

ccc acc gaa gca gtc 
pro thr glu ala val 

gtg gcg gtc gec gcg 
v ^ 1 a I a va 1 i 1 a a 1 a 

cge etc acc gaa gcg 
arg leu thr glu ala 

ttc ggc age gac gaa 
phe gly ser asp glu 

gee gag tea egg gaa 
ala glu ser arg glu 

ccg eta acg teg ctg 
pro leu thr ser leu 

ccg egg eta ccc aag 
pro arg leu pro lys 

qaa ttg tee aca ctg 
glu leu ser thr leu 
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1021/341 

ggc gga ttg ctg cgc 
gly gly leu leu arg 
1081/361 

tac gtg ctg etc ccc 
tyr val leu leu pro 
1141/381 

get egg age acg gac 
ala arg ser thr asp 
1201 /-4£1 

cag „cc uCg cgc gc« 
gin ser thr arg ala 
1261/421 

acg cat ggc caa gtt 
thr his gly gin val 
1321/441 

gac gaa tea ccc acg 
asp glu ser pro thr 
13:31/461 

gg:j gca gca gca aac 
gly ala ala ala a s n 
1441/481 

gca gec aac cca gta 
ala ala asn pro val 
1501/501 

aca tgg cgt gat tec 
thr trp arg aac ser 
1351/521 

acg cat gtt ggc cat 
arc; hi:; val qlv h i : - 
1621/54, 




ate gaa gac acc gac 
ile glu asp thr asp 

ggc cgt egg atg ccg 
gly arg arg met pro 

ate gag aac tct egg 
lie glu asn ser arg 

rtec Lay Lzg tgc agt 
thr AM3 leu cys ser 

ggc ccg agt agt ggg 
gly pro ser ser gly 

gta 1 1. c gee arc g c z 
val phe ala thr ala 

gta cag cca gra gtt 
val gin pro ala val 

ccg tea acc eta cga 
pro ser thr leu arg 

gac cat gac gec ceo. 
asp his asp ala pro 

egg cgc ggt gar gat 
or:; ar; gly asp asp 

egg gtt caa ccg ggc 
a r ;j v 1 1 c; 1 r. r> r o cj 1 '/ 



1051/351 

cca ggc ggc cag ccc 
pro gly gly gin pro 
1111/371 

att ccg cag ctt ccc 
ile pro gin leu oro 
1171/391 

ggt t.cg gcg aac gtt 
gly ser ala as;i va ] 
1231/4 11 

tac tgt tga aag cca 
tyr cys Ot\A ivs oro 
12 91/431 

cct agt aca gga aga 
pro ser thr gly arg 
1351/451 

gca gca gec ggg aac 
a ^ a ala a 1 a g 1 y a s :\ 
1411/4"! 

cga ctg gcg tta cce 
arg leu ala leu pro 
1471/4^1 

ggc gtt ggg tgg tac 

gl y va I gly t rp tyr 
15 31/511 

tec tgg gat ggt tec; 
ser trp asp gly a-r 
15 91/53! 



uga c;r ggt gv.c cgc 
ser gi y . j I y va 1 a : : 
16 51/551 




a r ; i - a * 



cct gga acg teg att 
pro gly thr ser lie 

ggt; gcg acg get ggc 
gly ala thr ala gly 

ate tea gtg gaa tct 
ile ser val glu ser 

cac cca tgc cag tec 
his pro cys gin ser 

gca acc tag cga cat 
ala thr AMii arg" his * 

ccc agg tta tgc tea 
pro arg leu cys ser 

acc gtc ccc gec ccr 
thr val pro ala pro 

ccg gec ggg tct gat 
pro ala gly ser asp 

cca acg ccc teg tgc 
pre thr pro ser eya, 

eg:; cac cgc egg c;j r 
"trg his arc a r r arg 

-* 

■'■ ■ act eg- 
-ire arg prr se: gly 



J ; ■ 
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Sequence codante Rv0983 predite par Cole el ai., 1998 (Nature 393-537 S 4<n . 
contenant seafinA; mature 393.537-544} et 



contenant seq60A: 

1/1 31/11 



atg gcc aag ttg gcc cga gta gtg ggc eta gta cag gaa gag caa cct aac aac ,t-„ 
Met ala ly, leu ala arg val val gl y leu val g lJ g'l u ^ gln p ^ ^ a % C * ? ^ 

aat cac cca cqg tat teg cca ccg ccg cag cag ccg gga acc cca ggt tat cct cag a IQ 
a^hx S pro arg tyr se r pre, p ro pro gin gln^pro gly thr pro % y tyc £ ^ J£ 

cag cag caa acg tac age cag cag ttc gac tgg cgt ta~ cca ccg tec ccg ccc cca caa 
gin gin gin thr tyr ser gin gin phe aso tro ara t-vr „r„ ^! ! 9 f g 

181/61 211/71' " ' " 

EE.- - 5 - - - - & % £ s «< :r: - 

ggc gtg att ccg acc atg acg ccc cct cct ggg atg g'r cgc'caa cgc crt cct qca ' 
g^y val lie pro thr met thr cro pro prD cilv ret ^r, , i g 59 • 

301/101 • p 331/1" g q " flr9 pro ar< 5 ala giy 

atg ttg gcc ate ggc; gey gtg acg ata gc? gtg gtg t--- gcc aac a-- rn~ 

Zl% ~ - " l t! " »• - vUi ~ "■' *" & & H 'S 

gca tec ctg gtc ggg ttc aac cqg qca cc - a-c , 

Sws l " ~ *» - - & p» Si X ?v S s i", lit 

H^i/iiL 451/151 

age gcg gcg cca age ate ccc gca g Cd aac arg rcn — aac „ 

ser ala ala pro ser lie pro ala a\a a 5I , J. *?* ^ ^ ^ " q gt 'f ™ 

431/161 5-1/171 ' J " 

gcc aag gtg gtg ccc agt gtc gtc atg ttg gal acc q- 7 ^ ,^ ri . 

ala lys val val pro ser va ! val ^ r * Z ^ ' " ^ 9 * g 

541/131 " 5-* r /i"=!' ' " 7 Ser giu glu - 

ggc tec ggc ate att ctg tct qz^ n c > t * ~ 

lol/2Cl " C aU 9 " t'C^ 1 : ! *' - " n ^ v^l ai !' ■ 

g-g g^c- c - • aag cct ccc ctg gcc act —7 • ; zzz 1- , -. . . ..... . 
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841/281 

ggg ate gtc age get etc aac cgt cca gtg 
gly ile val ser ala leu asn arg pro val 
901/301 

ace gtg ctg gac gee att cag acc gac gec 
thr val leu asp ala ile gin thr asp ala 
961/321 

ctg gtg aac atg aac get caa etc gtc gga 
leu val asn ir.et asn ala gin leu val gly 
1021/341 

g'ac tea gec gat gcg'cag age ggc teg ate 
asp ser ala asp ala gin ser giy ser lie 

i 0 6 1 / 3 6 : 

gee aag cgc ate gec gac gag ttg are age 
ala lys arg lie ala asp glu leu lie ser 
1141/381 

gtg cag gtg acc aat gac aaa gac acc ctg 
val gin val thr asn asn lys asn thr leu 
1201/401 

ggt get gec geg aac get gga gtg cceg day 
giy aia aia ala asn ala gly vai oro 1 v s 
1261/421 

ceg ate aac age geg gac gcg ttg gtt gec 
pro ile a si: ser aia asp ala leu val aia 
1321/441 

gtg gcg eta acc ttt cag gat ccc teg ggc 
va 1 ala leu thr p h e ain a s d sro ser el'/ 
1381/461 

aag gcg gag cag tga 
lys aia glu c; 1 : i OP A 



871/291 

teg acg acc ggc gag gec ggc aac cag aac 

ser thr thr gly glu ala gly asn gin asn 
931/311 

gcg ate aac ccc ggt aac tec ggg gg C gcg 

ala ile asn pro gly asn ser gly giy ala 
991/331 

gtc aac teg gec att gec acg ctg gqc gcg 

vai asn ser ala ile ala thr leu giy ala 
1051/3j1 

ggt etc ggt ttt gcg att cca gtc gac cag 

gly lee giy phe ala ile pro val asn ciln 

1 1 ; i / j / : 

ace ggc aag gcg tea cat gec tec ctg ggt 

y-V ' aia ser his ala ser leu gly 
117 1/391 

• : : ' ' 1 : * r "■ ■ 9^1 v'- * 0' 1 gec ggt 

: '/ J ; ;i : v:: — c val glu val val ala <j 1 v 
12 3 1/41; 

7* " g- -■ <• " : aag gtc gac gac cgc 

y ; y v ^ val val thr lys val asp asp arc: 
1201/431 

g c c g t g c g g tec aaa gcg ceg ggc gec a cy 

ala val arg ser lys ala pro gly ala thr 
1 3 c 1 / 4 b 1 

<77' age cgc a-:a gtg caa gtc acc etc ggc 

: ; : 7 t :. : val gin val thr leu gly 
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ORF d'apres Cole et al . , 1993 (Nature 393:537-544) en contenant Rv0983 

31/11 

tga gcc age teg acg cgt. cgc acg ctg age tgg tgg ttt ccg acc gcg gec egg gea ttc 
OPA ala ser ser the arg arg thr leu ser trp trp phe pro thr ala ala Jg ala phe 
61/21 91/31 * ^ 

ccg tgc agg age gec gtc tgg tgt ttg aae ggt ttt acc ggt egg cat egg cac ggg cgt 

pro cys -rg ser ala vax trp cys leu asn gly phe thr gly arg his arg his gly arg 
1/1/4 1 151/51 * * j 

tgc egg gtt egg gcc teg ggt tgg cga teg tea aac agg tgg tgc tea ace acg geg gat 
nU a e C l 9 glV ' ^1/tT d ' 3 r " r P ^ ser thr thr ala asp 

tgc tgc gea teg aag aca ccg acc cag gcg gcc age cc: ctg qaa cat caa ttt 

tu/tr a " seL iys u,r pro rhr gin aia t'tAT pr ° :eu giu arg arg phe ch; ^ 

tgc tec ccg gcc gtc gga tgc cga ttc cgc age ttc ccg gtg cga egg etg gcg etc qoa 

cys ser pro ala val gly cys arg phe arg ser phe pro val arg a" leu 111 u° Hy 
-1U1/101 331/111 

gea egg aca teg aga act etc .,gg gtt egg cqa acg tta tct cag tgg aat etc aqt c .-,- 

ala arg thr ser arg thr leu gly val arg arg thr leu ser gin trp' asn leu sit ^ 
Joi/121 391/131 

cgc gcg caa cct agt tgt gea gtt act gtt gaa age cac acc eat gcc agt era c~c a- 

arg ala glr. pro ser cys ala val thr val qlu s- V « thr h -s i, J * 

421/141 lw?r: ser pro drg mec 



9 Jl TJ ^ T 9t ? T , * gZa gaCJ Caa CCt ^ at 9 "9 

cac eca egg tat teg ecu ccg ccg cag caa ccg' gga acc cca ggt tat get cag ggg C a- 
sTl/181 dr ' J '"^ Pr ° ?r ° pt ° gl: ' ^f/fir tyr ala gin gly g ^ 



ccg crc ccg cac; cc;i 



5 7 1/19 1 

cac caa acq tac age ra;; cag ttc gac tgg 

gin thr tyr ser g,, gin P hc as ? rr: arg tyr p: , ; e : ore pro prr) 

ac: cag lac cct caa ccc Lac gag gcg ttg ggt. 
thr. glr. tyr aig gin ^:;> tyr qlu aia lea civ 



G61/221 



vqg ccg ggt ctg ata 
^'J pro gly lea il- 



WO 99/09186 



175/185 



PCT/FR98/01813 



901/301 

aag gtg gtg ccc agt 
lys val val pro ser 
961/321 

tec ggc ate att ctg 
ser gly ile ile leu 
1021/3-11 

gec gec aag cct ccc 
ala ala lys pro pro 
1031/361 

egg acc gca ccc ttc 
n r g liii ala pro phe 
1141/381 

gtt cag ggc gtc tec 
val gin gly val ser 
1201/401 

ggt cag cc.] gtg ctg 
gly gin pt j val leu 
1261/421 

ate gtc aq: get etc 
ilo val ser ala leu 
1321/441 

gtg ctg gac ycc att 
val leu asp ala ile 

1 3 tfl / 4 6 1 

gtg aac atg aae get 
va.j asn met asa ala 

1 4 4 1 / 4 3 1 

tea gec gat gcg cag 
s e r ala a s p a i a gin 
1501/5 .51 

aag eg:: ate .gee gac 
1 y.i are ile a : a asp 
15-U/521 

::ag qtg a j aat gac 
: ' : • : : a a : ; \ 



; - - a a . , . g } a *■* - 
: ae:i f-.- r all ar,:> 

: . : t o l 



gtc gtc atg ttg gaa 

val val met leu glu 

tct gec^gag ggg ctg 
ser ala glu gly leu 

ctg ggc agt, ceg ccg 
leu gly ser pro pro 

acg gtg gtg ggg get 
tnr val val gly ala 

ggg etc acc ccg ate 
gly leu thr pro ile 

gcg ate ggg teg ceg 
ala ile gly ser pro 

aac cgt cca gtg teg 
asn arg pro val ser 

cag acc gac gec gcg 
gin thr asp dia aid 

caa etc gtc gga gtc 
gin leu val gly val 

age ggc teg ate ggt 
ser gly ser ile gly 

gag ttg ate age a c i 
g 1 u Leu ile s e r t h r 

a a i ear a e : -:t ; g .; 



a - i - ■ a - t 
al i vl. a] t 



931/311 

acc gat ctg ggc cgc 
thr asp leu gly arg 
991/331 

ate ttg acc aac aae 
ile leu thr asn asn 
1051/351 

ccg aaa acg acg gta 
pro lys thr thr val 
1111/371 

gac ccc acc agt gat 
asp pro thr ser asp 
1171/391 

tec ctg ggt tee tec 
ser leu gly ser ser 
1231/411 

etc ggt ttg gag ggc 
leu gly leu glu gly 
12 91/431 

acg acc ggc gag gee 
thr thr gly glu ala 
1351/451 

ate aac ccc ggt aac 
i 1 e asn pro gly asn 
14 11/471 

aae teg gee att gee 
asn ser ala ile ala 
1471/491 

leu gly a 1 \ ile 

153;/ 511* 

gqr; tl ag g ; — cat. 
1* y lys a 1 a .a? : his 
1 _■■ * 1 . r : j * 

e ■ a; v - ; * - a i a 



1 * 



" : ■ : ' " \ i t - ■ j 

i / - - : 



cag teg gag gag ggc 
gin ser glu glu gly 

cac gtg ate gcg gcg 
his val ile ala ala 

acc ttc tct gac ggg 
thr phe ser asp gly 

ate ycc gtc: gtc cat 
ile ala val val arg 

teg gac ctg agg gtc 
ser asp leu arg val 

acc gtg ace deg ggg 
thr val thr thr gly 

ggc aac cag aac acc 
gly asn gin asn thr 

tec ggg ggc gcg ctg 
ser gly gly ala leu 

aeg ctg gg : gcg gac 
thr leu gly ala asp 

eca gtc ga i cag gee 
pro val asp gin a 1 a 




Li- 1 H; LLMf 



ML N T i KLo... i_ 2L 
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176/185 



Fragment amplify par PCR d'aprea lea sinulantes de sequence avec une aenne protease de 
la faraille HtrA de E. col: (cr6ation du site SnaDl a 1 ' ex t rerru te 3') et sous clone dans 
le vecteur pJVEDa: 



1/1 31/11 

gat ccg gcg ggg egg gtg teg gcg cag gcg tgg ctg gcg gtc acg gcg gtg egg gcg gtg 
asp pro ala gly arg val ser ala gin ala trp leu ala vaL thr ala val arg ala val 
61/21 91/31 

ccg ccg ggc tgt ggg gcg ccg gcg gcg gcg gtg gca atg gcg gga acg gcg ccg atg cca 
pro pro gly cya gly ala pro ala ala ala val ala met ala gly thr ala pre met pro 
121/41 151/51 

aca tea tea gcg gtg gag acg gtg gcr teg gcg gtg ccg gtg gcg gtg gcg gat ggc tct 
thr ser sor ala val glu thr val ala ser ala val pro val ala val ala aap gly 3er 
181/61 211/71 

acg gcg acg gcg ggg ccg gcg gac acg gcg gac aag gcg caa teg gec teg gcg gcg gcg 
thr ala thr ala gly pro ala dap thr ala a 3 p lys ala gin aer ala ser ala ala ala 
241/81 271/91 

ccg gcg gcg acg ggg gec ayg gcg gcg ccg gee gcg gac tgt ggg gta ctg gcg gC g ccg 
pro ala ala thr gly ala arg ala ala pro ala ala aap cy 5 gly val leu ala ala pro 
301/101 331/111 

gcg gac acg gcg ggc aag gcg gtg gta ccg ggg gec cac cgc tge ccg gle agg cag gca 
ala asp thr ala gly 1 ys ala val val pro gly ala hi 3 arg cys pro val arg gin ala 
361/121 391/131 

tgg gcg ccg egg gtg gcg ccg gtg ggc tga teg gca ac g gcg ggg ccg acg gcg acg gcg 
trp ala pro arg val ala pro val gly OPA 3 er ala thr al =i gl y pro ala ala thr a 1 a 
421/141 451/151 

gtg teg gcg cgt ccg gcg ggg teg ccg gag tag gey gtg ccg gcg gga acg cca tgc tga 
val 9cr ala arg prs ala gly ser pro glu AMB ala val oro ala gly thr pro cys OPA 
481/161 511/171 

teg ggc acg gcg gcg ccg gcg gcg ccg gcg gag aca gca gtt teg eta atg gcg egg ccg 
ser gly thr ala ala pro ala ala pro ala glu thr ala val 3 er» leu met ala are nro 
541/181 571/191 ^ P 

gcg gcg egg gcg gtg ccg gag ggc acc tct teg gca atg gcg ggt ccg gcg gec acg gcg 
ala ala arg ala val pro giu gly thr scr ser aid met ala gly pro ala aid thr ala 
601/201 631/21: 

gag ccg tea egg ccg gca aca ccg gta teg gtg gcg ccg gca ccg ccg gtg ggg acg cca 
glu pro 3cr arg pu aid thr pro val ser val ala pro ala ala sor val gly thr pro 
661/221 691/231 
ggc tga teg gec ac- g-g g-g — g gr- ; gtg ccg gcg ggg a: 
gly OPA scr ala thr val ala rro ala val ore aid cl y -J- 
721/241 751/2-M 
qcc gtg acn :jcg ggc ccg gtg gga acg ggg gcg c','.; qcg C" 



g :■ g c : 
a a d r 



gag cct tgg ttq 
g i u pr i trc leu 



q c g a : 
d i a t:, 



g i y tier g : y a: a io'i 
ccg gaa cue tgc ar;g 



c pu a. * pro 
g ,a: : " ; .; 



. A a . i 



:g gta acg gcg 
:r ala th:. a 1 - 



0-1 i eg 



■ i 
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177/185 



1/1 

ate egg egg ggc 
ile arg arg gly 
61/21 

cgc egg get gtg 
arg arg ala val 
121/41 

cat cgt cag egg 
his arg gin arg 
181/61 

egg cga egg egg 
arg arg arg arg 
241/81 

egg egg cga egg 
arg arg arg arg 
301/101 

egg aca egg egg 
arg thr arg arg 
361/121 

ggg cgc cgc ggg 
gly arg arg gly 
421/141 

tgt egg eg- gtc 
cys arg arg val 
181/161 

egg gca egg egg 
arg ala arg arg 
541/181 

egg cgc ggg egg 
arg arg gly arg 
601/201 

age cgt cac ggc 
ser arg hi 3 gly 
661/221 

get qat egg cca 
ala a 3p arg pro 
72 1/241 

ccg tga egg egg 
pro OPA arg arg 
791/261 

<■'-] ; err 

34i/2S: 



0 j 1/30 1 



ggg tgt egg cgc 
gly cy3 arg arg 

ggg cgc egg egg 
gly arg arg arg 

tgg aga egg tgg 
trp arg arg trp 

ggc egg egg aca 
gly arg arg thr 

ggg cca ggg egg 
gly pro gly arg 

gca agg egg tgg 
ala arg arg tip 

tgg cg~ egg tgg 
trp arg arg trp 

egg egg gqt cgc 
arg arg gly arg 

cgc egg egg cgc 
arg arg arg arg 

tgc egg agg gca 
cys arg arg ala 

egg caa cac egg 
arg gin !u:-i a:g 

egg tgg cgc egg 
arq trp arg ar; 

gee cc;g tgg qaa 
a] a arg trp gl u 



31/11 
agg cgt ggc tgg 
arg arg gly trp 

91/31 
egg egg tgg caa 
arg arg trp gin 

151/51 
cct egg egg tgc 
pro arg arg cya 

211/71 
egg egg aca agg 
arg arg thr arg 

271/91 
cgc egg ccg egg 
arg arg pro arg 

331/111 
tac egg ggg ccc 
tyr arg gly pro 

391/131 
get ga: egg caa 
ala a s o arg gin 

4 51/151 
egg agt agg egg 
arg ser arg arg 

511/171 
egg eg 5 aga cag 
arg arg arg gin 

571/191 
cct ctt egg caa 
pro leu arg gin 

631/2 1 : 
tat egg tgg cgc 
tyr arg t rp nrg 

691/231 
r.gj rge egg egg 
arg cy:j arg arg 

751/251 
egg ggg cac tgg 
arg glv arg trp 

8 11/2';: 



egg tea egg egg 
arg ser arg arg 

tgg egg gaa egg 
trp arg glu arg 

egg tgg egg tgg 
arg trp arg trp 

cgc aat egg cct 
arg asp. arg pro 

act gtg qqq tac 
thr val gly tyr 

ace get gec egg 
thr ala ala arg 

egg egg' ggc egg 
arg arg gly arg 

tgc egg egg ga * 
cys arg arg glu 

cag ttt cgc taa 
gin phe arg OCH 

tgg egg gtc egg 
trp arg val arg 

egg egg cgt egg 
are arg arg arg 

arg t : ,:> ala . I <- 



tgc ggg egg tgc 
cys gly arg cya 

cgc cga tgc caa 
arg arg cya gin 

egg atg get eta 
arg met ala leu 

egg egg egg cgc 
arg arg arg arg 

tag can car rnn 
trp arg arg arg 

tea ggc agg eat 
ser gly arg hi3 

egg cga egg egg 
arg arg arg arg 

cgc cat get gat 
arg hi 3 ala asp 

tgg cgc ggc egg 
trp arg gly arg 

egg cca egg egg 
arg pro arg arg 

tgg gga cgc cag' 
trp gly arg gin 

age ctt qgt tgg 
lou gly trp 

egg caa egg cca 
arg qln arg arc; 



WO 99/09186 



PCT/FR98/018I3 



178/185 



1/1 

tec ggc ggg gcg ggt 
ser gly gly ala gly 
61/21 

gcc ggg ctg tgg ggc 
ala gly leu trp gly 
121/41 

ate gtc age ggt gga 
lie val ser gly gly 
1S1/C1 

ggc gac ggc ggg gcc 
gly asp gly gly ala 
241/81 

ggc ggc gac ggg ggc 
gly gly a:ip gly gly 
301/101 

gga cac ggc ggg caa 
gly hi3 gly gly gin 

361/121 

ggc gcc gcg ggt ggc 
gly ala ala gly gly 
421/141 

gtc ggc gcg tec ggc 
val gly ala ser gly 
431/161 

ggg cac ggc ggc gcc 
gly his gly gly ala 
541/181 

ggc gcg ggc ggt gcc 
gly ala gly gly ala 
601/201 

gcc gtc acq gcc ggc 
ala val thr ala gly 
661/221 

ctg ate gqc cac gqt 
leu lie gly hi a gly 
7 2 1/24 L 

cgt gac gcc ggg c:;c 
arq asp gly gly pro 
731/261 



gac gg-; q:: c::,; ggc 
asp gly a 1 a ::r ;■ cl y 
^4 1/2?! 




:: r ^ caa a a .1 : 



gtc ggc gca ggc gtg 
val gly ala gly val 

gcc ggc ggc ggc ggt 
ala gly gly gly gly 

gac ggt ggc etc ggc 
a3p gly gly leu gly 

ggc gga cac ggc gga 
gly gly his gly gly 

cag ggc ggc gcc ggc 
gin gly giy ala giy 

ggc ggt ggt acc ggg 
gly gly gly thr gly 

gcc ggt ggg ctg ate 
ala gly gly leu lie 

ggg gtc gcc gga gta 
gly val ala gl y val 

gqc ggc gcc ggc gga 
gly gly ala gly gly 

gga ggg cac etc ttc 
gly gly hia leu phe 

aac acc ggt ate ggt 
a-3n thr gly lie gly 

gqc gcc ggc ggt gcc 
gly ala giy giy ala 

gqt qqg aac qqq ggc 
: J * V y-j yly giy 




ar a ql y :u-vt al i 



i rq :: : ■ is : : : 



31/11 

get ggc ggt cac ggc 
ala gly gly hi3 gly 
91/31 

ggc aat ggc ggg aac 
gly aan gly gly Asn 
151/51 

ggt gcc ggt ggc ggt 
gly ala gly gly gly 
211/71 

caa ggc gca ate ggc 
gin gly ala ile gly 
271/91 

cgc gga clg tgg ggt 
arg gly leu trp gly 
331/111 

ggc cca ccg ctg ccc 
gly pro pro Ipi: pro 
391/131 

ggc aac ggc ggq gcc 
gly asn gly gly ala 
451/151 

ggc ggt gcc gqc qqq 
gly gly ala gly gly 
511/171 

gac age agt ttc get 
a3p ser ser phe ala 
571/191 

ggc aat ggc yyy tec 
gly asn gly gly ser 
631/211 

ggc gcc qgc gqc gtc 
qly ala gly gly val 
691/2.31 

gqc qqq gac c:; ; q . c 
qly gly asp a: q ala 
751/251 

qct gcc gg.- : C aq 
ala giy 7 ; y -\r. 
811/27 1 



- 1 " a;c Or A v 



ggt gcg ggc ggt gcc 
gly ala gly gly ala 

ggc gcc gat gcc aac 
gly ala asp ala asn 

ggc gga tgg etc tac 
gly gly trp leu tyr 

etc ggc ggc ggc gcc 
leu gly gly gly a l a 

act ggc ggc gcc ggc 
thr gly gly ala gly 

ggt cag gca ggc atg 
gly gin ala gly met 

ggc -ggc gac ggc ggt 
qly gly asp gly gly 

aac gcc atg ctg ate 
asn ala met leu lie 

aat ggc gcg gcc ggc 
a3n gly ala 1 ' ala gly 

qgc ggc cac ggc gga 
giy gly his gly gly 

?qt ggg gac gcc agg 
qly q i y agp ala arg 

gga gcc ttg gtt gqc 
qly ala leu val qly 

tac q q c aac ggc q q ... 
tyr gly asn gly gly 

: ■■' 1 -'"- I 3cq g; • 

' - • --r.\ tea a : ; 
AMR y : : arc se r t :. : 

:;it c- q c > tac r • 
1 - c vi p tyr v,i ■ 

" * "' * ; \ ' v; ct a c 
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Sequence codante Rv0125 
contenant seqSOA: 

1/1 

atg age aat teg cgc cgc 
Met ser asn ser arg arg 
61/21 

gtc ggg ctg ggc ctg gec 
val gly leu gly leu ala 
121/41 

egg ttc gee gac ttc ccc 
arg phe ala asp phe pro 
101/61 

cca cag gtg gtc aac ate 
pro gin val val asn ile 
241/H1 

ggc ate gtc ate gat ccc 
gly ile val ale asp pro 
301/101 

ace gac ate aat gcg ttc 
thr asp ile asn ala phe 
361/121 

tat gac cgc acc cag gat 
tyr asp arg thr gin asp 
421/141 

gcg gcg ate ggt ggc ggc 
ala ala ile gly gly gly 
481/161 

ggg cag ggc gga acg ccc 
gly gin gly gly thr pro 
541/181 

cag gcg teg gat teg ctg 
gin ala ser asp ser leu 

601/201 

go: gcg ate ca.; qgt 
ala ala lie gin pro- qly 
^1/221 

ggt atg aac a a o c acq 



179/185 

predite par Cole et a:., 



31/11 

cgc tea etc agg tgg tea tgg 
arg ser leu arg trp ser trp 
91/31 

acg gcg ccg gee cag gcg gee 
thr ala pro ala gin ala ala 
151/51 

gcg etg ccc ccc gac ccg tee 
ala leu pro leu asp pro ser 
211/71 

aac acc aaa cr.g ggc tac aac 
asn thr lys leu gly tyr asn 
271/91 

aac ggt gtc gtg ctg acc aac 
asn gly val val leu thr asn 
331/111 

age gtc: ggc tec ggc caa acc 
ser val gly ser gly gin thr 
391/131 

gtc gcg gtg ctg cag ctg cgc 
val ala val leu gin leu arg 
451/151 

gtc gcg gtt ggt gag ccc gr c 
val ala val gly glu pro val 
511/171 

cgc gcg gtg cct ggc agg gtg 
arg aid val pro gly arg val 

■ 571/191 
ace ggt gec gaa gag aca ttg 
thr gly ala glu glu thr lee 
631/21 L 

gat teg ggc ggg cc: gt : go.: 
ao-p ser gly gly pro val 

6 9 1 / ? "i 1 

tec q a t aac ttc cag c t ■; t _ 



1998 (Nature 3 93 : 537-b 4 4 ) et 



ttg ctg age gtg ctg get gec 
leu leu ser val leu ala ala 

ccg ccg gec ttg teg cag gac 
pro pro ala leu ser gin asp 

gcg atg gtc gec caa gtg ggg 
ala met val ala gin val gly 

aac gec gtq ggc gec ggg acc 
asn ala val nl ;/ ai.i „ 

aac cac gtg ate gcg ggc gec 
asn his val ile ala gly ala* 

tac ggc gtc qat gtg gtc ggg 
tyr gly val asp val val gly 

ggt gec ggt ggc ctg ccg teg 
gly ala gly gly leu pro- ser 

gtc gcg atg ggc aac age ggt 
val ala met gly asn ser gly 

gtc gcg etc ggc caa acc gtg 
val ala leu qly gin thr val 

udj ggg ttg ate cag ttc gat 
asn gly leu 1 1 - _* c; 1 n phe asp 

aaj a:;:: eta gga eag gtg gte ' 

<isr. gly ,en gly q \ :i V al val •* * - 

oaq ;;<r egq ~oa qga ttc ger 



■al 
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ORF d'apres Cole et al . , 1993 {Nature 393:537-544) et contenant Rv0125: 
1/1 31/11 

tag aaa aat cct gcc gcc egg acc ctt aag get ggg aca att tct gat age tac ccc gac 
AMB ly 3 asn pro ala ala arg thr leu ly 3 ala gly thr lie ser asp 3 er tyr pro asp 
61/21 91/31 

aca gga ggt tac ggg atg age aat teg cgc cgc cgc tea etc agg tgg tea tgg ttg ctg 
thr gly gly tyr gly met 3 er a 3 n aer arg arg arg ser leu arg trp ser trp leu leu 
121/41 151/51 

age gtg ctg get gcc gtc ggg ctg ggc ctg gee acg gcg ccg gcc cag geg gcc ccg ccq 
der Vdl leu dla val 91/ «3ly lea aia thi ala pro ala gin ala ala pro pro 

101/61 211/71 

gcc ttg teg cag gac egg ttc gcc gac ttc ccc gcg ctg ccc etc gac ccg tec gcg atg 
ala leu ser gin a 3 p arg phe ala asp phe pro ala leu pro leu asp pro ser ala met 
241/81 271/91 

gtc gee caa gtg ggg cca cag gtg gtc na^ ale ddc acc aaa ctg ggc tac aac aac gcc 
val ala gin val gly pro gin val val asn lie asn thr lys leu gly tyr asn aaa ala 
301/101 331/111 

gtg ggc gcc ggg acc ggc ate gtc ate gat ccc aac ggt gtc yty ctg acc aac aac cac 
val gly ala gly thr gly He val He asp pro asn gly val val leu thr a3n asn his 
361/121 391/131 

gtg ate gcg ggc gcc acc gac ate aat gcg ttc age gtc ggc tec ggc caa acc tac ggc 
val lie ala gly ala thr a 3 p lie asn ala phe 3 er val gly ser gly gin th- - yr qiy 
421/141 451/151 

gtc gat gtg gtc ggg tat gac cgc acc cag gat gtc gcg gtq erg cag ctg cgc ggt qc- 
val asp val val gly tyr asp arg tnr gin asp val ala val leu gin leu arg gly ala 
481/161 511/171 

ggt ggc ctg ccg teg gcg gcg ate ggt ggc ggc gtc gcg gtt ggt gag ccc gtc gtc gcg 
gly gly leu pro ser ala ala lie gly gly gly val ala val gly glu pro val val ala 
541/181 4 571/191 

atg ggc aac age ggt ggg cag ggc gga acg ccc cgt gcg gtg :ct ggc agg gtg gtc gcg 
met gly asn ser gly gly gl n gly g l y thr pro arg ala val pro gly aiq val val ala 
601/201 631/211 

etc ggc caa acc gtg cag gcg teg cnt teg ctg acc ggt q_ yaa gag aca ttg aac gga 
leu gly gin rhr val gin ala ser as P 3 er leu thr gly ala glu glu thr leu asn gly 
661/221 691/231 

r~g ate cag ttc gat gcc gcg ate cag ccc ggt gat Leg qgc g::g ccc gtc qtc a,: gg, 
leu :1c gin pr.e asp ala ala lie g.n pro gly asp gly cly nro val -a 1 asp ~W 

T2 1A-M1 , t # 751/251 W 

eta gga cag gtg gtc ggt atg aac acg gcc gcg tec gat aac tt.c cag ctg r— r- dr , Q r * " 
leu gly gin val val gly not asn thr ala ala ser asp as:; phe cln leu .m : ^ l^, 



a t :i 



gly aln gly phe ala ;le pro il- g.y glu ala met. all 

i 4 i/.." 1 671/291 

— y 'J' V' y r— 1 * h r val h : :: : .. o r;ly rro thr ala 

"'^ / ^ 1 1 ' ^si/311 

:;ac aac aa . ggr aa : gg:: -: i i ;, Ja cqc qtg ct 

.up d:in a:sn gly ar.n gly al a i: g val gl- arg val vi. 
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Experiences d ' hybridation moleculaire d'une sonde specifique 
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